Qy 1261 ACCAT CCAGCC GGAC CTC AGCACCAC CACCACCAC CT AC CAGGGCAGT CT CT GTCC C CGG 1320 

I I M I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I II 
Db 1261 ACCAT CCAGC CAGACCT CAGCACC AC CACT AC CACCTAC CAGGGCAGT CT AT GTT CGAGG 1320 

Qy 1321 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1380 

I I I I I I I I I I I I I I II I I I I I j I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 1321 CAGGATGGAC C C AGCCC CAAGTT C C AGCTCT CTAATGGT CAC CT GCT CAGC C CACT GGGG 1380 

Qy 1381 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 1440 

I I I I M I I I II I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I | | M 
Db 1381 AGT GGC CGC CAT AC GTT GCAC CAC AGCTCAC C CACCT CT GAGGCTGAGGACT T CGT CT CC 1440 

Qy 1441 C GC CT CTC CAC CCAGAACT ACTT C CGCT C C CT GC C C C GAGGCAC CAGCAACAT GAC CT AT 1500 

M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 1441 CGCCTCTCCACCCAAAACTACTTTCGTTCCCTGCCCCGCGGCACCAGCAACATGGCCTAC 1500 

Qy 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1560 

I i I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACGGGGATCAGCCTCCTC 1560 

Qy 1561 AT CCCCCC AGAT GC CAT ACCCC GAGGGAAGAT CT ATGAGAT CTACCT CACG CT GC ACAAG 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I II I I I I I 
Db 1561 AT AC C C CC GGAT GCCAT C C CC CGAGGAAAGAT CT ACGAGATCT AC CT C ACACT GCACAAG 1620 

Qy 1621 C C GGAAGAC GT GAGGTT GC CCCT AGCT GGCT GT C AGACC CT GCT GAGT CC CAT C GTT AGC 1680 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 CCAGAAGACGT GAGGT TGC CC CTAGCT GGCT GT CAGAC CCTGCT GAGT CCAGT CGT TAGC 1680 

Qy 1681 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1740 

I M I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 1681 TGTGGGCCCCCAGGAGTCCTGCTCACCCGGCCAGTCATCCTTGCAATGGACCACTGTGGA 1740 

Qy 1741 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1800 

I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1741 GAGCCCAGCCCTGACAGCTGGAGTCTGCGCCTCAAAAAGCAGTCCTGCGAGGGCAGTTGG 1800 

V 

Qy 1801 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1860 

M I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 GAGGAT GT GCT GCACCTT GGT GAGGAGT CACCTT C CCAC CT CT ACT ACTGC CAGCT GGAG 1860 

Qy 1861 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1920 

Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 GCCGGGGCCTGCTATGTCTTCACGGAGCAGCTGGGCCGCTTTGCCCTGGTAGGAGAGGCC 1920 

Qy 1921 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml I I M I I I I I I I II I I I I I II I II 
Db 1921 CTCAGCGTGGCTGCCACCAAGCGCCTCAGGCTCCTTCTGTTTGCTCCCGTGGCCTGTACG 1980 

Qy 1981 T CCCT CGAGTACAACAT CCGGGTCTACTGCCT GCATGACACCCACGAT GCACT CAAGGAG 2040 

I I I I I I I II I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I 
Db 1981 T CCCT T GAGTACAACAT C C GAGT GT ACT GCCT AC ACGACAC C C AC GAC GCT CT CAAGGAG 2040 

Qy 2041 GTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCAC 2100 

M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I II I I I I I I I I I 
Db 2041 GTGGTGCAGCTGGAGAAGCAGCTAGGTGGACAGCTGATCCAGGAGCCTCGCGTCCTGCAC 2100 

Qy 2101 TTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGG 2160 



Db 



1 I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2101 TT CAAAGACAGTT ACC ACAAC CT ACGT CTCT CCAT CCACGACGT GC CC AGCTCC CT GT GG 2160 



Qy 2161 AAGAGTAAGCT CCTT GTCAGCT AC C AGGAGATC C CCTTTTATCACAT CT GGAATGGCACG 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 2161 AAGAGCAAGCTACTTGTCAGCTACCAGGAGATCCCTTTTTACCACATCTGGAACGGCACC 2220 

Qy 2221 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2280 

I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 2221 C AGCAGTATCT GCACT GCACCTT CAC C CTGGAGCGCAT CAACGC CAGCAC CAGCGACCT G 2280 

Qy 2281 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 234 0 

MINIMI I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II 

Db 2281 GCCT GCAAGGT GT GGGTGTGGCAGGT GGAGGGAGAT GGGCAGAGCTT CAACAT CAACT TC 2340 

Qy 2341 AACATCACCAAGGACACAAGGTTT GCT GAGCT GCT GGCTCT GGAGAGT GAAGCGGGGGT C 2400 

M I I I I I I I I I I I II I M I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 AACATCACTAAGGACACAAGGTTTGCTGAATTGTTGGCTCTGGAGAGTGAAGGGGGGGTC 2400 

Qy 2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGC75JVAAGATCATC 2460 

Qy 2461 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2520 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 
Db 24 61 GC CAGT CT GGAC C CAC C CTGCAGC C GGGGCGCCGACT GGAGAACT CT AGC CCAGAAACTT 2520 

Qy 2521 CAC CT GGACAGC CAT CT CAGCTT CT T T GCCT CCAAGC C CAGCC CC ACAGC CAT GAT CCT C 2580 

I I I I I I II I I I I I I II I I I I I I II I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 CAC CT GGACAGC CAT CT T AGCTT CTTT GCCT C CAAGC C CAGCCCTACAGCCAT GAT C CT C 2580 

Qy 2581 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2640 

I M I I II II II I I I M I I II I II I I I I I I I I I II II I I II I I I I II I I I I I I III 
Db 2581 AACCTATGGGAGGCACGGCACTTCCCCAACGGCAACCTCGGCCAGCTGGCAGCAGCTGTG 2640 

Qy 2641 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2697 

M I II I I I I II I I I I I II II I I I I M I I I I II I I I II I I I I I I I I II I III 
Db 2641 GCCGGACTGGGCCAACCAGATGCTGGCCTCTTCACGGTGTCGGAGGCCGAGTGTTGA 2697 
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Qy 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGTGCTCCTGGGCATAGTCCTCGCCGCCTGGCTT 60 

Qy 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

II II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 CGTGGTTCGGGTGCCCAGCAGAGTGCCACGGTGGCCAATCCAGTGCCCGGTGCCAACCCC 120 

Qy 121 GACCT GCT T CC C CACT T CCT GGT GGAGCCCGAGGAT GT GT ACAT CGT CAAGAACAAGCCA 180 

I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 121 GACCTGCTGCCCCACTTCCTGGTAGAGCCTGAGGACGTGTACATTGTCAAGAACAAGCCG 180 

Qy 181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

III II I I I I I I I I I I I I I II I I Mill I I I I I I I I I I I I I I I I I I I I Mill. 

Db 181 GTGTTGTTGGTGTGCAAGGCTGTGCCTGCCACCCAGATCTTCTTCAAGTGCAATGGGGAA 240 

Qy 241 T GGGT GC GCCAGGTGGACC AC GT GATCGAGC GCAGCAC AGAC GGGAGCAGT GGGCTGCCC 300 

II I I I I II I I II I II II I II II II I II I II II III I II I II II I I I I 

Db 241 T GGGT CCGCCAGGTC GAT C AC GT AATT GAAC GCAGCAC C GACAGCAGCAGC GGATT GC CA 300 

Qy 301 ACC AT GGAGGT CC GC AT T AAT GT CT CAAGGCAGCAGGT CGAGAAGGT GTT C GGGCT GGAG 360 

I I I II II II I II I I II II II II I II I I I I II I I II I II II I I I I I I I I I I I I 
Db 301 ACC AT GGAGGT CC GT AT CAAC GT AT CGAGGCAGC AGGT AGAGAAAGT GTTT GGGCT GGAG 360 

Qy 361 GAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCC 420 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

361 GAATACTGGTGCCAGTGTGTGGCATGGAGCTCCTCGGGTACCACCAAAAGTCAGAAGGCC 420 

421 T ACAT CC GCAT AGCC AGATT GCGCAAGAACTTCGAGCAGGAGC CGCT GGC CAAGGAGGT G .480 

I I I I I I I I II III I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I III 

421 T ACAT CCGGATT GCCTATTT GCGCAAGAACTTT GAGCAGGAGCC ACT GGCCAAGGAAGT G 480 

481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

II I I I I I I I I I I I I I II II II II II II II II II I I I I I I I I I I III 

481 T CACT GGAGCAAGGCAT T GT ACT AC CT T GT CGCCC CCCAGAAGGAAT C CCCCCAGCT GAG 540 

541 GTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATC 600 

I I I I II I I I II II II I I I I I I I I I I I I I I I I II I I I II I I I I I I I I II I I I I 
541 GTGGAGTGGCTTCGAAATGAGGACCTCGTGGACCCCTCCCTCGATCCCAATGTGTACATC 600 

601 AC GC GGGAGCACAGC CT GGT GGT GC GACAGGCC CGCCTT GCT GACAC GGC CAACTACACC 660 

I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I 

601 ACGCGGGAGCACAGCCTAGTCGTGCGTCAGGCCCGCCTGGCCGACACGGCCAACTACACC 660 

661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

II I I I I I I I I I I I I I I I I I II I II I I I I I III .1111 II II I I I I I II II 

661 TGTGTGGCCAAGAACATCGTAGCCCGTCGCCGAAGCACCTCTGCAGCGGTCATTGTTTAT 720 

721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 780 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 GTGAACGGTGGGTGGTCGACGTGGACTGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGT 780 

781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 840 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I 
781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCACCTCTCAACGGGGGCGCCTTC 840 

841 T GT GAGGGGCAGAAT GT CCAGAAAAC AGCCT GCGC CAC CCT GT GCCCAGT AGAC GGC AGC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II III 
841 T GTGAGGGGCAGAAT GT CCAGAAAACAGCCT GCGC CACT CT GT GCC CAGT GGAT GGGAGC 900 

901 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 960 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 TGGAGTTCGTGGAGTAAGTGGTCAGCCTGTGGGCTTGACTGCACCCACTGGCGGAGCCGC 960 

961 GAGT GCT CT GACCC AGC ACC C C GCAAC GGAGGGGAGGAGT GCCAGGGC ACT GAC CT GGAC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I 
961 GAGTGCTCTGACCCAGCACCCCGCAATGGAGGTGAGGAGTGTCGGGGTGCTGACCTGGAC 102 0 

1021 ACCCGCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCC 1080 

I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I II I I I I I I I I I 
1021 ACCCGCAACTGTACCAGTGACCTCTGCCTGCACACCGCTTCTTGCCCCGAGGACGTGGCT 1080 

1081 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 CTCTACATCGGCCTTGTCGCTGTGGCTGTGTGCCTCTTCTTGCTGTTGCTGGCCCTTGGA 1140 

1141 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1200 

III I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I III 
1141 CTCATTTACTGTCGCAAGAAGGAAGGGCTGGACTCCGATGTGGCCGACTCGTCCATCCTC 1200 

1201 ACCT CAGGCTT CCAGCC C GT C AGCAT CAAGCCCAGCAAAGCAGACAAC CC CCAT CT GCTC 1260 
I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 



Db 1201 ACCTCGGGCTT CC AGCCT GT CAGCAT CAAGC CCAGCAAAGCAGACAAC CCC CACCT GCT C 1260 

Qy 1261 AC CAT C CAGCCGGAC CT C AGCACC ACCACCAC CACCTAC C AGGGCAGTCTCTGT CCC C GG 1320 

I I I I I I I I I I I I I II I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I III I II 
Db 1261 AC C AT CCAGCCAGACCTCAGCACCAC CACT ACCACCT ACCAGGGCAGT CT AT GT T CGAGG 1320 

Qy 1321 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1380 

I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I Mill 
Db 1321 CAGGAT GGACCCAGC CC CAAGTT CCAGCTCTCTAAT GGT CAC CTGCTCAGC CCACT GGGG 1380 

Qy 1381 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 1440 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1381 AGT GGCCGCCAT ACGTT GCACCACAGCT CAC CCACCT CT GAGGCT GAGGACTT C GTCT C C 144 0 

Qy 1441 CGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 1500 

I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 CGCCTCTCCACCCAAAACTACTTTCGTTCCCTGCCCCGCGGCACCAGCAACATGGCCTAC 1500 

Qy 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1560 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I 

Db 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACGGGGATCAGCCTCCTC 1560 

Qy 1561 AT C CC C CC AGAT GC CAT AC CC CGAGGGAAGATCT AT GAGATCT ACCT CAC GCT GCACAAG 1620 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 AT ACC C CCGGAT GCC AT CC C C C GAGGAAAGATCT AC GAGATCT AC CT CACACT GCACAAG 1620 

Qy 1621 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1680 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1621 CCAGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCAGTCGTTAGC 1680 

Qy 1681 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1740 

I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 1681 TGTGGGCCCCCAGGAGTCCTGCTCACCCGGCCAGTCATCCTTGCAATGGACCACTGTGGA 1740 

Qy 1741 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I III 
Db 1741 GAGCCCAGCCCTGACAGCTGGAGTCTGCGCCTCAAAAAGCAGTCCTGCGAGGGCAGTTGG 1800 

Qy 1801 GAGGAT GT GCT GCAC CT GGGCGAGGAGGCGCCCT CC CAC CTCT ACT ACT GCCAGCT GGAG 1860 

I I I I I I I I I I II I I I II II I I I II I I II I I I I I I II I I I I I I I I II II I I I I I I I 

Db 1801 GAGGAT GTGCT GCAC CTT GGT GAGGAGT CACCTT CC C ACCTCT ACT ACT GC C AGCT GGAG 1860 

Qy 1861 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1920 

Ml I II I I I II I I II II II I I I II I I I I I II II II I M II I I II I I I II II M I I 
Db 1861 GCCGGGGCCTGCTATGTCTTCACGGAGCAGCTGGGCCGCTTTGCCCTGGTAGGAGAGGCC 1920 

Qy 1921 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 1980 

II M II I I I M I I I I I M I I II I II II III I II I II I II M M I II M I I I II 

Db 1921 CTCAGCGTGGCTGCCACCAAGCGCCTCAGGCTCCTTCTGTTTGCTCCCGTGGCCTGTACG 1980 

Qy 1981 TC C CT C GAGT ACAAC AT CC GGGT CT ACT GC CTGC AT GAC ACC CAC GAT GCACT CAAGGAG 2040 

I I I II I II M I II I II M I II I II II I II II I I II II II I M II II I I I II M 
Db 1981 T C CCTT GAGT ACAAC AT C C GAGT GT ACT GC CTAC ACGAC ACC C ACGACGCT CT CAAGGAG 2040 

Qy 2041 GTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCAC 2100 

I I I till Ml I II II I II Mill II II II II I I II I II I I II II I M II II M M I 

Db 2041 GT GGT GC AGCT GGAGAAGC AGCT AGGT GGACAGCT GAT C CAGGAGC CT CGC GT C CT GCAC 2100 



Qy 

Db 



2101 TT CAAGGACAGTT ACCACAAC CTGC GC CTAT CC AT CCAC GAT GT GCCCAGCT C CCT GTGG 2160 

I I I I I I I I I I II I I I I I I I I II II II I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
2101 TT CAAAGACAGTT ACCACAAC CT AC GT CTCT CCAT CC ACGAC GT GCCCAGCT CCCT GT GG 2160 



Qy 2161 AAGAGTAAGCT CCT TGT CAGCTACCAGGAGAT CC C CTTTTATCAC ATCT GGAATGGCACG 2220 

I II I I I I I I I I II I I I I I I I I I I I II I I I I I I I I II I I I I I II I I I I I I I I I I I 
Db 2161 AAGAGCAAGCT ACTT GT C AGCT AC C AGGAGAT CC CTT TTTACCACAT CT GGAACGGCAC C 2220 

Qy 2221 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2280 

I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I Mi l I I I I I I I II I I I I I I 
Db 2221 C AGC AGT AT CT GC ACT GCACCTT CACC CTGGAGCGCAT CAAC GCCAGC AC CAGCGACCT G 2280 

Qy 2281 GC CT GCAAGCT GT GGGT GTGGCAGGTGGAGGGCGACGGGCAGAGCTT C AGCAT CAACTT C 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I 
Db 2281 GCCTGCAAGGTGTGGGTGTGGCAGGTGGAGGGAGATGGGCAGAGCTTCAACATCAACTTC 2340 

Qy 2341 AACAT CACCAAGGACACAAGGT TT GCT GAGCT GCT GGCT CT GGAGAGT GAAGCGGGGGT C 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 AACAT CACTAAGGACACAAGGTTTGCTGAATT GTT GGCT CT GGAGAGT GAAGGGGGGGTC 2400 

Qy 2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAAAAGATCATC 2460 

Qy 2461 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2520 

I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2461 GCCAGTCTGGACCCACC CTGC AGC CGGGGCGCCGACTGGAGAACTCTAGCCCAGAAACTT 2520 

Qy 2521 CACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTC 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 CACCTGGACAGCCATCTTAGCTTCTTTGCCTCCAAGCCCAGCCCTACAGCCATGATCCTC 2580 

Qy 2581 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 2581 AACCTATGGGAGGCACGGCACTTCCCCAACGGCAACCTCGGCCAGCTGGCAGCAGCTGTG 2640 

Qy 2641 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2697 

II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 2641 GCCGGACTGGGCCAACCAGATGCTGGCCTCTTCACGGTGTCGGAGGCCGAGTGTTGA 2697 



RESULT 3 
US-08-808-982-2 

Sequence 2, Application US/08808982 
Patent No. 5939271 
GENERAL INFORMATION: 

APPLICANT: Tessier-Lavigne, Marc 
APPLICANT: Leonardo, E. David 
APPLICANT: Hink, Lindsay 
APPLICANT: Masu, Masayuki 
APPLICANT: Kazuko, Keino-Masu 
TITLE OF INVENTION: Netrin Receptors 
NUMBER OF SEQUENCES: 8 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: SCIENCE & TECHNOLOGY LAW GROUP 
STREET: 268 BUSH STREET, SUITE 3200 



CITY: SAN FRANCISCO 

STATE: CALIFORNIA 

COUNTRY: USA 

ZIP: 94104 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 

COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.30 
; CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/808, 982 

FILING DATE: 

CLASSIFICATION: 530 
ATTORNEY/AGENT INFORMATION: 
; NAME: OSMAN, RICHARD A 

; REGISTRATION NUMBER: 36,627 

REFERENCE/ DOCKET NUMBER: UC96-217 
; TELECOMMUNICATION INFORMATION: 
; TELEPHONE: (415) 343-4341 

TELEFAX: (415) 343-4342 
; INFORMATION FOR SEQ ID NO: 2: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 1787 base pairs 
; TYPE: nucleic acid 

STRANDEDNESS: double 
; TOPOLOGY: linear 

; MOLECULE TYPE: cDNA 
US-08-808-982-2 

Query Match 57.6%; Score 1552.4; DB 2; Length 1787; 

Best Local Similarity 98.5%; Pred. No. 0; 

Matches 1651; Conservative 0; Mismatches 16; Indels 9; Gaps 8; 

Qy 1025 GCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCT 1084 

I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 GCAACTGTACCAGTGACCTCTG-GTACACACTGCTTCTGGCCCTGAGGACGTGGCCCTCT 59 

Qy 1085 ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 1144 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 60 ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 119 

Qy 1145 T TT ATT GCC GGAAGAAGGAGGGGCT GGACT C AGAT GT GGCT GACT CGT CCATT CT CAC CT 1204 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 120 TT T ATT GCC GGAAGAAGGAGGGGCT GGACT C AGAT GT GGCT GACT CGT CCATT CT CAC CT 179 

Qy 1205 C AGGCTT CCAGCC CGT CAGCAT C - AAGC CCAGCAAAGCAGACAAC CC CCAT CT GCT C ACC 1263 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 180 C AG GCTT CCAGCC CGT CAGCAT CTAAGC CCAGCAAAGCAGACAAC CC CCAT CT GCT C ACC 239 

Qy 1264 ATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAG 1323 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 240 ATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAG 299 

Qy 1324 GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 1383 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 300 GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 359 



Qy 1384 GGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGC 1443 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 360 GGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGC 419 

Qy 1444 CT CT CCACCCAGAACT ACTT CCGCTCC CTGC CCC GAGGCAC CAGCAACAT GAC CT AT GGG 1503 

I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 420 CTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGG 479 

Qy 1504 ACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATC 1563 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 480 ACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTCCTCATC 539 

Qy 1564 CC C CCAGAT GC CAT AC C CCGAGGGAAGAT CT ATGAGAT CTACCT CACGCT GC ACAAGC C G 1623 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 540 C C CC CAGAT GC CAT ACC C CGAGGGAAGAT CT ATGAGAT CTAC CT CACGCT GCACAAGCC G 599 

Qy 1624 GAAGAC GT GAGGTT GCCC CT AGCT GGCT GT CAGAC CCT GCT GAGT CCCAT C GTT AGCTGT 1683 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I II I I I I I I I I I I I I 

Db 600 GAAGAC GTGAGGTT GC CC CT AGCT GGCT GT CAGACCCT GCT GAGT C C CAT C GTTAGCTGT 659 

Qy 1684 GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 1743 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 660 GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 719 

Qy 1744 CCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAG 1803 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 720 CCCAGCCCTGACAGCTGGAGCCTGGCCCTCAAAAAGCAGTCGTGCGAGGG-AGCTGGGAG 778 

Qy 1804 GATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCC 1863 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 779 GATGT-CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCC 837 

Qy 1864 AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 1923 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 838 AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 897 

Qy ' 1924 AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 1983 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 898 AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 957 

Qy 1984 CT CGAGT ACAACAT C CGGGT CT ACT GC CT GCAT GACACC CAC GAT GCACT CAAGGAGGT G 2043 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 958 CT CGAGT ACAACAT CCGGGT CTACTGCCTGCATGACACCCACGATGCACTCAAGGAGGT G 1017 

Qy 2044 GT GCAGCT GGAGAAGCAGCT GGGGGGACAGCT GAT C CAGGAGCC AC GGGT CCT GC ACTT C 2103 

I I I I.I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1018 GTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTT- 1076 

Qy 2104 AAGGAC AGT T ACCACAACCT GC GC CT AT C CAT CC AC GAT GT GC CCAGCT CCCT GT GGAAG 2163 

I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1077 AAGGACAGTTACCACAACCT — GC CCT AT CAT CCAC GAT GT GCCCAGCT CCCT GT GGAAG 1134 

Qy 2164 AGTAAGCTC CT TGT C AGCT AC CAGGAGAT C CC CTT T TAT CACAT CT GGAAT GGC AC GCAG 2223 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1135 AGTAAGCTC CTTGT C AGCT AC CAGGAGAT C C C CTT T TAT CACAT CT GGAAT GGCACGCAG 1194 

Qy 2224 CGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCC 2283 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1195 CGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCC 1254 

Qy 2284 T GCAAGCT GT GGGT GT GGCAGGT GGAGGGCGACGGGCAGAGCT TCAGC AT CAACTT CAAC 2343 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I 
Db 1255 T GCAAGCT GT GGGT GT GGCAGGT GGAGGGCGAC GGGC AGAGCTT CAGCAT CAACTT CAAC 1314 

Qy 2344 AT CAC CAAGGACACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GAAGC GGGGGT CCC A 2403 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 1315 AT CAC CAAGGACACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GAAGCGGGGGTCCCA 1374 

Qy 2404 GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCC 2463 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 1375 GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCC 1434 

Qy 2464 AGCCTGGACGCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 2523 

I I I I I I I I I I II I I I I I I I II I II I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1435 AGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 1494 

Qy 2524 CT GGACAGC C AT CT C AGCTT CTTT GCCT C CAAGCC CAGC CC CAC AGCCAT GAT C CT CAAC 2583 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1495 CT GGACAGC CAT CT CAGCTT CTTT GCCT C CAAGCC CAGC CCC ACAGC CAT GAT C CT CAAC 1554 

Qy 2584 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 2643 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1555 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 1614 

Qy 2644 GGACT GGGCCAGCCAGAC GCT GGC CTC - TTCACAGT G- T C GGAGGCT GAGT GCT GA 2697 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1615 GGGACTGGCCAGCAGGACGGTGGCTTCTTTCACAGTGTTCGGAGGCTGAGTGCTGA 1670 



RESULT 4 

US-09-306-902A-2 

; Sequence 2, Application US/09306902A 
; Patent No. 6277585 

GENERAL INFORMATION: 
; APPLICANT: Tessier-Lavigne, Marc 
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; Masu, Masayuki 
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; TITLE OF INVENTION: Netrin Receptors 
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CORRESPONDENCE ADDRESS: 

ADDRESSEE : SCIENCE & TECHNOLOGY LAW GROUP 
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STATE: CALIFORNIA 
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APPLICATION NUMBER: US/09/306, 902A 
FILING DATE: 07-May-1999 
CLASSIFICATION: <Unknown> 
ATTORNEY/AGENT INFORMATION: 
NAME: OSMAN, RICHARD A 
REGISTRATION NUMBER: 36,627 
; REFERENCE/ DOCKET NUMBER: UC96-217 

; TELECOMMUNICATION INFORMATION: 

TELEPHONE: (415) 343-4341 
TELEFAX: (415) 343-4342 
INFORMATION FOR SEQ ID NO: 2: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 1787 base pairs 
; TYPE: nucleic acid 

STRANDEDNESS : double 
TOPOLOGY: linear 
MOLECULE TYPE: cDNA 

SEQUENCE DESCRIPTION: SEQ ID NO: 2: 
US-09-306-902A-2 

Query Match 57.6%; Score 1552.4; DB 3; Length 1787; 

Best Local Similarity 98.5%; Pred. No. 0; 

Matches 1651; Conservative 0; Mismatches 16; Indels 9; Gaps 8; 

Qy 1025 GCAACT GT AC CAGT GACCT CT GT GT AC ACAGT GCTT CT GGCC CT GAGGAC GT GGC C CT CT 1084 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I II I I I I II I I 
Db 1 GCAACTGTACCAGTGACCTCTG-GTACACACTGCTTCTGGCCCTGAGGACGTGGCCCTCT 59 

Qy 1085 ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 1144 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 60 ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 119 

Qy 1145 TTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCT 1204 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 120 TTT ATT GCC GGAAGAAGGAGGGGCT GGACT CAGAT GTGGCT GACT CGT CCATT CT CAC CT 179 

Qy 1205 C AGGCT T CC AGCC CGT CAGCAT C- AAGC C CAGCAAAGC AGACAACCCCC AT CT GCT CAC C 1263 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I 
Db 180 C AGGCTT CC AGC C CGT CAGCAT CTAAGC CCAGCAAAGC AGACAAC CCC CAT CT GCT CAC C 239 

Qy 1264 AT C CAGC CGGAC CT C AGCAC CAC CAC CAC CAC CTAC CAGGGCAGT CT CT GT CC CCGGCAG 1323 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 240 AT C CAGC CGGAC CTC AGCAC CAC CAC CAC CAC CTAC CAGGGCAGT CT CT GT CC CCGGCAG 299 

Qy 1324 GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 1383 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 300 GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 359 

Qy 1384 GGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGC 1443 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 360 GGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGC 419 

Qy 1444 CTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGG 1503 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 420 CTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGG 479 



Qy 



1504 



ACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATC 



1563 



Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



480 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
ACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTCCTCATC 539 



1564 C CC CCAGAT GCCAT AC CCC GAGGGAAGAT CT AT GAGAT CT ACCT CACGCT GCACAAGCCG 1623 
I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
540 CCC C CAGAT GCCAT AC C C CGAGGGAAGAT CT AT GAGAT CT ACCT CAC GCT GCACAAGCCG 599 

1624 GAAGAC GT GAGGTT GC C C CT AGCT GGCT GTCAGAC CCT GCT GAGTCC CAT CGTT AGCT GT 1683 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I II I I I I 
600 GAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGT 659 

1684 GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 1743 
I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
660 GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 719 

1744 CCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAG 1803 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
720 CCCAGCCCTGACAGCTGGAGCCTGGCCCTCAAAAAGCAGTCGTGCGAGGG-AGCTGGGAG 778 

1804 GATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCC 1863 
I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
779 GATGT-CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCC 837 

1864 AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 1923 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
838 AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 897 

1924 AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 1983 

I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 



898 



957 



1984 CT CGAGT AC AACAT CC GGGT CT ACT GCCT GC AT GAC AC C CAC GATGC ACT CAAGGAGGT G 2043 
I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

958 CT C GAGT ACAACAT CC GGGT CT ACT GCCT GC AT GACAC C CAC GATGC ACT CAAGGAGGT G 1017 

2044 GTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTC 2103 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

1018 GTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTT- 1076 

2104 AAGGAC AGTT ACCACAAC CT GCGC CTAT CCAT C CAC GAT GT GCC CAGCT C CCT GT GGAAG 2163 

I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1077 AAGGAC AGTT ACCACAAC CT — GCC CTAT CAT C CAC GAT GTGCC CAGCT C C CT GT GGAAG 1134 

2164 AGT AAGCT CCTT GT CAGCT AC CAGGAGAT CC C CTTTT AT C ACAT CT GGAAT GGCACGCAG 2223 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

AGT AAGCT CCTT GT CAGCT AC CAGGAGAT CC C CTTTT AT CACAT CT GGAAT GGCACGCAG 1194 



1135 



2224 



1195 



CGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCC 2283 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I 
CGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCC 1254 



2284 TGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAAC 2343 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1255 TGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAAC 1314 

2344 ATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCA 2403 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



1315 ATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCA 1374 



Qy 2404 GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCC 2463 

II I M II I I I I I I 1 I I I I I I I I I I I I I I II I I | | | | | M I I I I I I I I I I I I I I I I I I I I I 
Db 1375 GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCC 1434 

Qy 2464 AGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 2523 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I 
Db 1435 AGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 14 94 

Qy 2524 CT GGACAGCCATCT CAGCTT CTTT GCCT C CAAGCCCAGC CCCACAGCCAT GAT CCTCAAC 2583 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1495 CT GGACAGCC AT CT CAGCTT CTTT GCCT C CAAGC C CAGC CCCACAGCCAT GAT CCT CAAC 1554 

Qy 2584 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 2643 

I I II I II I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 1555 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 1614 

Qy 2644 GGACTGGGCCAGCCAGACGCTGGCCTC-TTCACAGTG-TCGGAGGCTGAGTGCTGA 2697 

II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1615 GGGACTGGCCAGCAGGACGGTGGCTTCTTTCACAGTGTTCGGAGGCTGAGTGCTGA 1670 



RESULT 5 
US-08-808-982-3 

Sequence 3, Application US/08808982 
Patent No. 5939271 
GENERAL INFORMATION: 

APPLICANT: Tessier-Lavigne, Marc 
APPLICANT: Leonardo, E. David 
APPLICANT : Hink, Lindsay 
APPLICANT: Masu, Masayuki 
APPLICANT: Kazuko, Keino-Masu 
TITLE OF INVENTION: Netrin Receptors 
NUMBER OF SEQUENCES: 8 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: SCIENCE & TECHNOLOGY LAW GROUP 
STREET: 268 BUSH STREET, SUITE 3200 
CITY: SAN FRANCISCO 
STATE: CALIFORNIA 
COUNTRY: USA 
ZIP: 94104 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC-DOS/MS-DOS 
SOFTWARE: Patentln Release #1.0, Version #1.30 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/ 08/ 808 , 982 
FILING DATE: 
CLASSIFICATION: 530 
ATTORNEY/AGENT INFORMATION: 
NAME: OSMAN, RICHARD A 
REGISTRATION NUMBER: 36,627 
REFERENCE/ DOCKET NUMBER: UC96-217 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (415) 343-4341 



TELEFAX: (415) 343-4342 
; INFORMATION FOR SEQ ID NO: 3: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 2831 base pairs 
; TYPE: nucleic acid 

STRANDEDNESS: double 
; TOPOLOGY: linear 

MOLECULE TYPE: cDNA 
US-08-808-982-3 

Query Match 31.2%; Score 841.4; DB 2; Length 2831; 

Best Local Similarity 60.0%; Pred. No. 8.4e-182; 

Matches 1638; Conservative 0; Mismatches 961; Indels 130; Gaps 9; 

Qy 98 AC C CAGTGCCT GGT GCCAAC C C GGAC CT GCTTC C C CACTT CCT GGT GGAGC CCGAGGAT G 157 

Ml IN II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 104 ACT CCTTC CC AT C AGCACCCGCGGAGC AGCT GC CT CACTTCCT GCT GGAACCAGAGGAT G 163 

. Qy 158 TGTACATCGTCAAGAACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGA 217 

I I I I I I I I I I I I I I I I I I I I I I I J III I I I I I I I I I I I I I I I 

Db 164 CCT ACATC GTAAAGAACAAGCCAGT GGAATTGCACT GCCGAGCCT TCCCT GC CAC ACAGA 223 

Qy 218 TCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCA 277 

M I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II Ml 
Db 224 T CT ACTT CAAGT GTAAT GGC GAGT GGGTT AGCCAGAAAGGCCAC GT CACGC AGGAGAGCC 283 

Qy 278 CAGACGGGAGCAGT GGGCT GCCCACC AT GGAGGT C C GCATTAAT GTCTCAAGGCAGCAGG 337 

II I I II II III I I I I I I I II I I I I I I I I I I I I I I 

Db 284 T GGATGAGGC CACAGGCTT GC GAATAC GAGAGGTGCAGAT AGAGGTGTC GC GGCAGCAGG 343 

Qy 338 TCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGG 397 

I Ml I I II Mill I II I I I I I I I I I I I I II I I I II II II I I M M I I II 
Db 344 TGGAGGAACTTTTTGGGCTCGAGGACTACTGGTGTCAGTGCGTGGCCTGGAGCTCTTCGG 403 

Qy 398 GCAC CACCAAGAGTCAGAAGGCCT ACAT C CGCAT AGC CAGAT T GC GCAAGAACTTC GAGC 457 

I I II I I M II I I I I I M I I I I I II I II I III I II II II II I I II I II I 

Db 4 04 GAACCACCAAGAGTC GCCGAGC CT AC AT CCGCATT GC CTACTT GCGC AAGAACTTTGACC 463 

Qy 458 AGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCAC 517 

M I I I M II I II M I I II I I I I M I I I I I II I I I I I II I M II II 
Db 4 64 AGGAGCCTCTGGCGAAGGAGGTACCCTTGGATCATGAGGTCCTTCTGCAGTGCCGCCCAC 523 

Qy 518 CGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGT 577 

I I M I I llll II M M II II I M I II I II II I I I I I I I I 

Db 524 C AGAGGGAGT GCCT GT GGCT GAGGT GGAATGGCT CAAGAAT GAAGAT GT CAT C GATCCC G 583 

Qy 578 C CCT GGAC C C CAAT GT AT ACAT CAC GCGGGAGC ACAGC CT GGT GGTGCGACAGGCCC GCC 637 

I I I M I I II I llll II || | | | M | I I I I I I II II I I 

Db 584 CT C AGGACACT AACT T C CT GCT CAC CAT T GAC C ACAAC CT CAT CATC CGC CAGGCGC GCC 643 

Qy 638 TTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCG 697 

I I M I I I I II II II I I I I II I I II II I I I I I I I I I II I I II I I II I 

Db 644 T CT CAGACAC AGCCAACT AC AC CT GT GT GGCAAAGAAT ATT GT GGCCAAGC GC C GGAGC A 703 



Qy 

Db 



698 
704 



757 
763 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 



758 



764 



818 



824 



878 



884 



938 



944 



998 



TCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGG 817 

I I I I I I I I I M II II I I I I I I I I I I I I III I I I I I I I I I I I I I 

C CT GCTCTAAC CGCT GCGGCC GAGGTT GGCAGAAACGT ACT AGGACCT GC ACCAACCCAG 823 

CGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCA 877 

I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

C C C CACT CAAT GGAGGT GCCT T CT GCGAGGGACAGGCTT GC CAGAAGACGGCTT GCAC C A 883 

CCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGG 937 
I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CCGTGTGCCCAGTGGATGGAGCGTGGACTGAGTGGAGCAAGTGGTCCGCCTGCAGCACAG 943 

ACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGG 997 
III I I I I I I I I I I I I I I I I I I I I I II I I I I I MINIM I 
AGTGTGCGCACTGGCGCAGCCGCGAGTGCATGGCACCGCCGCCCCAGAACGGAGGCCGTG 1003 



AGTGCCAGGGCACTGACCTGGACACCCGCAACTGTACCAGTGACCTCTGTGTACACAGTG 1057 

Mil I I I I I I I I I I I I I I I I I I I II I I I I II I II 

1004 ACTGCAGCGGGACGCTACTTGACTCCAAGAACTGCACCGATGGGCTGTGCGTGCTGAATC 1063 

1058 CTTCTGGCC CTGAGGACGTGGCCCTCT 1084 

I I I I I I I I I I I I I I 

1064 AGAGAACTCTAAACGACCCTAAAAGCCGCCCCCTGGAGCCGTCGGGAGACGTGGCGCTGT 1123 

1085 AT GTGGGCCT C ATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCC 1141 

I I I I I I I I I I I I I I I I II I I I I III II III I 

1124 ATGCGGGCCTCGTGGTGGCCGTCTTTGTGGTTCTGGCAGTTCTCATGGCTGTAGGAGTGA 1183 

1142 TCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT C 1198 

I I I I M I III II I I I I I I I I I I I I I I I I I I I 

1184 T C GT GT AC CGGAGAAACT GC C GGGACTT CGAC ACGGACAT CACT GACT CCT CT GCT GCC C 1243 

1199 T C AC CTCAGGCT T CCAGCCC GT C AGCAT CAAGC C CAGCAAAGCAGACAAC C CC C AT CT GC 1258 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

1244 T CACT GGT GGT T T C C ACC CCGT CAACT T CAAGACT GCAAGGCC CAGCAACCCAC AGCT CC 1303 

1259 T C ACCATC CAGC CGGACCT CAGCAC C ACC AC C AC CACCTAC CAGGGCAGT CT CT 1312 

I II II I I I I I I I I I III I I I I I I I I II III 

1304 TGCACCCATCCGCCCCTCCGGACCTAACGGCCAGTGCTGGCATCTACCGCGGACCTGTGT 1363 



1313 



1364 



1328 



1424 



1379 



GTCCCCGGCAGGA TG 1327 

I III I I I I I I 

AT GC CCT GCAGGACT CT GCC GACAAGAT CC CT AT GACTAATT C ACC C CTT CTGGAT C C CT 1423 

GGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCC CCTGG 1378 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TGCCCAGCCTCAAGATCAAGGTCTATGACTCCAGCACCATCGGCTCTGGGGCTGGCCTGG 1483 



GT GGC GGC C GC C AC ACACT GCAC C AC AGCT CT C C CAC CT CT GAGGC C GAGGAGTT C GT CT 1438 
I I I I IN III I I I I I I I I I I I I I I I 

1484 CTGATGGAGCCGACCTGCTGGGTGTCTTACCACCCGGTACATACCCAGGCGATTTCTCCC 1543 

1439 CCCGCCTCTCCACCCAGAAC TACTTCCGCTCCC 1471 

I I I I I I I I I I I I I II 

1544 GGGACACCCACTTCCTGCACCTGCGCAGCGCCAGCCTTGGTTCCCAGCACCTCCTGGGCC 1603 



Qy 1472 TGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGA 1531 

I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I 

Db 1604 TCCCTCGAGACCCCAGCAGCAGTGTCAGTGGCACCTTTGGTTGCCTGGGTGGGAGGCTGA 1663 

Qy 1532 T GAT C CCTAATACAGGT AT CAGCCT CCT CAT C CCCC CAGATGCCATAC CCCGAGGGAAGA 1591 

I I I I I I II I I I I I I I I I III I I I I I I I I I I I I I I I 

Db 1664 CCATTCCCGGCACAGGGGTCAGCCTGTTGGTACCAAATGGAGCCATTCCCCAGGGCAAGT 1723 

Qy 1592 TCTATGAGATCTACCTCACGCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCT 1651 

I I I I I II I II II I I I I I I I I I I I I I III 

Db 1724 T CT AT GACTTGT AT CT ACGT AT CAACAAGACT GAAAGCAC CCT CCC ACTTT CGGAAGGTT 1783 

Qy 1652 GTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGC 1711 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1784 CCCAGACAGTATTGAGCCCCTCGGTGACCTGCGGGCCCACGGGCCTCCTCCTGTGCCGCC 1843 

Qy 1712 CAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCC 1771 

III I I I I I I I I I I I I I I I I II II II I I I I I I I I I 

Db 1844 CTGTTGTCCTCACTGTGCCCCACTGTGCTGAAGTCATTGCCGGAGACTGGATCTTCCAGC 1903 

Qy 1772 TCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGC 1831 

II I I I II I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I 

Db 1904 T CAAGACC C AGGCC CAT C AGGGC CACT GGGAGGAGGT GGT GACTTT GGAT GAGGAGACT C 1963 

Qy 1832 CCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGC 1891 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1964 T GAACACCCC CT GCTACT GC CAGCT AGAGGCTAAAT CCT GCCACAT C CTGT T GGACCAGC 2023 

Qy 1892 TGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGC 1951 

I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I II 

Db 2024 TGGGTACCTACGTGTTCACGGGCGAGTCCTACTCCCGCTCCGCAGTCAAGCGGCTCCAGC 2083 

Qy 1952 TGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCC 2011 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2084 TAGCCATCTTCGCCCCAGCCCTCTGCACCTCCCTGGAGTATAGTCTCAGGGTCTACTGTC 2143 

Qy 2012 T G CAT GAC ACCCAC GAT GCACT CAAGGAGGT GGTGCAGCT GGAGAAGCAGCT GGGGGGAC 2071 

MINIMI I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 214 4 TGGAGGACACTCCT GCAGCACTGAAGGAGGTCCTAGAGCT GGAGAGGACTCTGGGTGGCT 2203 

Qy 2072 AGCT GATCCAGGAGCCACGGGTCCTGCACTT CAAGGACAGTTACCACAACCT GCGCCTAT 2131 

I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2204 ACT T GGT GGAGGAGCC CAAGACTT T GCT CTT TAAGGACAGTT AC CACAAC CT ACG- CT CT 2262 

Qy 2132 C CAT C CAC GATGT GCC CAGCT CCCT GT GGAAGAGTAAGCT CCT T GT CAGCT AC CAGGAGA 2191 

I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2263 CC CTC CAT GACAT CCC C CAT GCCC ACT GGAGGAGCAAAC TACT GGC CAAGT AC CAGGAGA 2322 

Qy 2192 TCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGG 2251 

I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I 

Db 2323 TTCCCTTCTACCATGTGTGGAACGGCAGCCAGAAAGCCCTGCACTGCACTTTCACCCTGG 2382 

Qy 2252 AGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGG 2311 

III I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2383 AGAGACAT AGCCT AGC CT C CACT GAGTT CACCT GTAAGGTCT GC GT GC GGC AGGT AGAAG 2442 

Qy 2312 GC GACGGGCAGAGCTT CAGC ATCAACT T CAACATC AC CAAGGACACAAGGTT TGCT G 2368 



Db 



I I I I I I I I I I I I I I I II II II III I 
2443 GGGAAGGCCAGATTTTCCAGCTGCACACCACGCTGGCTGAGACGCCTGCTGGCTCCCTGG 2502 



Qy 2369 AGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCA 2428 

I II .1 II I III I I I I I I I I I I I I I I I I I I 

Db 2503 ATGCACTCTGCTCTGCCCCTGGCAATGCTGCCACCACACAGCTGGGACCCTATGCCTTCA 2562 

Qy 2429 AGAT C CC CTT C CTCATT CGGCAGAAGATAATT T CC AGCCT GGAC C C AC CCT GT AGGC GG G 2488 

I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 2563 AGAT ACCACT GT CCATCC GCCAGAAGAT CT GCAAC AGCCT GGACGCC CCCAACT CAC GGG 2622 

Qy 2489 GTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCATCTCAGCTTCTTTG 2548 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2623 GCAAT GACT GGC GGCTGT TGGCACAGAAGCT CT C CAT GGACC GGT AC CTGAACT ACTT CG 2682 

Qy 2549 CCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCA 2608 

Mill! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2683 C CAC CAAAGCT AGT CCCACAGGC GT GAT CTT AGACCT CT GGGAAGCT C GGC AGC AGGATG 2742 

Qy 2609 AC GGCAAC CT CAGC CAGCTGGCT GCAGCAGT GGCT GGACT GGGCCAGC CAGAC GCT GGCC 2668 

III I I I I I I I I I I I I II III I I I I I I I I II 

Db 274 3 AT GGGGAC CT CAACAGCCT GGCCAGTGC CT TGGAGGAGAT GGGCAAGAGT GAGAT GCT GG 2802 

Qy 2669 T CTT CACAGT GT CGGAGGCT GAGT GCT GA 2697 

I II I I I I I I I I I I II 

Db 2803 T AGC CAT GAC CACT GAT GGCGATT GCT GA 2831 



RESULT 6 

US-09-306-902A-3 

; Sequence 3, Application US/09306902A 
; Patent No. 6277585 

GENERAL INFORMATION: 
; APPLICANT: Tessier-Lavigne, Marc 

; Leonardo , E. David 

; Hink, Lindsay 

; Masu, Masayuki 

; Kazuko, Keino-Masu 

TITLE OF INVENTION : Netrin Receptors 
NUMBER OF SEQUENCES: 9 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: SCIENCE & TECHNOLOGY LAW GROUP 
STREET: 268 BUSH STREET / SUITE 3200 
CITY: SAN FRANCISCO 
STATE: CALIFORNIA 
; COUNTRY: USA 

ZIP: 94104 
; COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC- DOS/MS-DOS 
SOFTWARE: Patentln Release #1.0, Version #1.30 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/09/306, 902A 
FILING DATE: 07-May-1999 
CLASSIFICATION: <Unknown> 
ATTORNEY/AGENT INFORMATION: 



; NAME: OSMAN, RICHARD A 

REGISTRATION NUMBER: 36,627 
REFERENCE/ DOCKET NUMBER: UC96-217 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (415) 343-4341 
TELEFAX: (415) 343-4342 
INFORMATION FOR SEQ ID NO: 3: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 2831 base pairs 
; TYPE: nucleic acid 

STRANDEDNESS: double 
TOPOLOGY: linear 
; MOLECULE TYPE: cDNA 

SEQUENCE DESCRIPTION: SEQ ID NO: 3: 
US-09-306-902A-3 

Query Match 31.2%; Score 841.4; DB 3; Length 2831; 

Best Local Similarity 60.0%; Pred. No. 8.4e-182; 

Matches 1638; Conservative 0; Mismatches 961; Indels 130; Gaps 9; 



Qy 98 ACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATG 157 

III III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 104 ACT C CT T CCCAT CAGCAC CCGC GGAGCAGCT GC CT CACTT C CT GCTGGAAC CAGAGGAT G 163 

Qy 158 T GT ACAT CGT CAAGAACAAGC CAGT GCT GCTT GT GT GCAAGGCCGT GC CCGCCACGCAGA 217 

I I I II I I I I I I I I I I I I I I I I I I I Ml III I II I I I I I I I I I 

Db 164 CCT ACAT CGT AAAGAACAAGC CAGT GGAATTGCACT GCCGAGCCTTCCCT GCCACACAGA 223 

Qy 218 T CTT CTT CAAGT GCAACGGGGAGT GGGT GC GC CAGGT GGAC CACGTGATCGAGC GCAGCA 277 

III I I I I I II I I II II I I I I I I I I I I I I I I I I I I I I I II III 
Db 224 T CTACTT CAAGT GTAATGGCGAGT GGGTT AGC C AGAAAGGCCAC GT C ACGC AGGAGAGC C 283 

Qy 278 C AGACGGGAGCAGTGGGCT GC C CAC CAT GGAGGT CC GC AT TAAT GT CT CAAGGCAGCAGG 337 

I I I I II II III I I I I I I I II I I I I I I I I I I I I I I 

Db 284 T GGAT GAGGC CACAGGCT T GCGAATACGAGAGGT GC AGAT AGAGGT GT CGC GGCAGCAGG 343 

Qy 338 T C GAGAAGGT GTT C GGGCT GGAGGAAT ACT G GT GC C AGT GC GT GGC AT GGAGCT CCT C GG 397 

I III I I II Mill I II I I I I M I M I I I I I I I M II I I I II I II I I II I 
Db 344 TGGAGGAACTTTTTGGGCTCGAGGACTACTGGTGTCAGTGCGTGGCCTGGAGCTCTTCGG 403 

Qy 398 GCAC CAC CAAGAGTC AGAAGGC CT ACAT C C GCAT AGCCAGAT T GC GCAAGAACTTCGAGC 457 

I I MM I I II I I M II I II I I I I I II I I Ml I I II I I I I II I I M M I 

Db 404 GAAC CAC CAAGAGTCGCC GAGC CT ACAT CCGCAT T GCCT ACTT GC GCAAGAACTTT GACC 4 63 

Qy 458 AGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCAC 517 

II II I II I M II I II II I I I I I II I I M I I I I M I I I I I I I II I I 

Db 4 64 AGGAGCCTCT GGC GAAGGAGGT AC C CTT GGAT CAT GAGGTC CTT CT GC AGT GC C GC C CAC 523 

Qy 518 CGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGT 577 

I I I I II I I II II I I I I I II I II I I M II I I I M I I I I I I 
Db 524 CAGAGGGAGT GCCT GT GGCT GAGGT GGAAT GGCT CAAGAAT GAAGAT GTCAT C GAT CCCG 583 

Qy 578 CCCTGGACCCCAATGTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCC 637 

I I II I I I I I I I I II I I I I I I M I I I I I M I I I II I I 

Db 584 CT C AGGAC ACTAACTT C CT GCT CAC C ATT GAC CACAAC CT CATCAT C C GCC AGGC GCGCC 643 

Qy 638 T T GCT GACAC GGC CAACT ACAC CT GCGT GGCCAAGAACATCGTGGCAC GT C GC CGCAGCG 697 



I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 644 TCT C AGACACAGC CAACTACACCTGTGT GGCAAAGAATATT GT GGCCAAGCGC CGGAGCA 703 

Qy 698 CCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCG 757 

I III I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 704 CGAC GGC CACAGT CAT C GT CT AT GT GAAC GGAGGT T GGT CC AGCT GGGC AGAATGGT CAC 763 

Qy 758 TCTGCAGCGCCAGCTGT GGGC GCGGCT GGC AGAAACGGAGCCGGAGCTGCACCAACCCGG 817 

I I I I I I I I I II II II I I I I I I II I I I I II I I II I I I I I I I I I I 

Db 764 CCTGCTCTAACCGCTGCGGCCGAGGTTGGCAGAAACGTACTAGGACCTGCACCAACCCAG 823 

Qy 818 CGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCA 877 

I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 824 CCCC ACT CAAT GGAGGT GCCTTCTGCGAGGGACAGGCTTGCCAGAAGACGGCTTGCACCA 883 

Qy 878 CCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGG 937 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 884 CC GT GTGC CCAGT GGAT GGAGCGT GGACT GAGT GGAGCAAGT GGT C CGCCT GCAGCACAG 943 

Qy 938 ACTGCACCCACT GGC GGAGCCGT GAGT GCTCTGACCCAGCACCCCGCAACGGAGGGGAGG 997 

III I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 944 AGT GT GC GC ACT GGC GCAGC C GCGAGT GC AT GGC AC C GC C GC C CCAGAACGGAGGC C GTG 1003 

Qy 998 AGTGCCAGGGCACTGACCT GGACACCCGCAACT GTACCAGTGACCT CTGTGTACACAGTG 1057 

I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I II 

Db 1004 ACT GCAGCGGGAC GCT ACT T GACT CCAAGAACT GCAC C GAT GGGCT GT GC GT GCTGAATC 1063 

Qy 1058 CTTCTGGCC CTGAGGACGTGGCCCTCT 1084 

I I I I I I I I I I I I I I 

Db 1064 AGAGAACTCTAAACGACCCTAAAAGCCGCCCCCTGGAGCCGTCGGGAGACGTGGCGCTGT 1123 

Qy 1085 ATGTGGGCCTC ATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCC 1141 

I I I I I I I I I I I I I I I I II II I I III II III I 

Db 1124 ATGCGGGCCTCGTGGTGGCCGTCTTTGTGGTTCTGGCAGTTCTCATGGCTGTAGGAGTGA 1183 

Qy 1142 TCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT C 1198 

I I I I I I I III II I I II I I I I I I I I I I I I I I I 

Db 1184 TCGTGTACCGGAGAAACTGCCGGGACTTCGACACGGACATCACTGACTCCTCTGCTGCCC 1243 

Qy 1199 TCACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCATCTGC 1258 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1244 T CACT GGT GGT TT CCACCCC GTCAACT T C AAGACT GCAAGGCC CAGCAAC C CAC AGCT CC 1303 

Qy 1259 T C ACCAT CCAGCC GGAC CT C AGCAC CAC CAC CAC CAC CT AC CAGGGCAGT CTCT 1312 

I II II I I I I I I I I I III I I I I I I I I I I III 

Db 1304 TGCACCCATCCGCCCCTCCGGACCTAACGGCCAGTGCTGGCATCTACCGCGGACCTGTGT 1363 

Qy 1313 GTCCCCGGCAGGA TG 1327 

I I.I I I I I I I I 

Db 1364 ATGCC CT GCAGGACT CT GCC GACAAGAT C CCT AT GACTAAT T C ACC C CT T CT GGAT CCCT 1423 

Qy 1328 GGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCC CCTGG 1378 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1424 TGCCCAGCCTCAAGATCAAGGTCTATGACTCCAGCACCATCGGCTCTGGGGCTGGCCTGG 1483 

Qy 1379 GTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCT 1438 

I I I I III III I I I I I I I I I I I I I I I 



Db 1484 CTGATGGAGCCGACCTGCTGGGTGTCTTACCACCCGGTACATACCCAGGCGATTTCTCCC 1543 

Qy 1439 CCCGCCTCTCCACCCAGAAC TACTTCCGCTCCC 1471 

I I I II I I I I I I I I II 

Db 1544 GGGACACCCACTTCCTGCACCTGCGCAGCGCCAGCCTTGGTTCCCAGCACCTCCTGGGCC 1603 

Qy 1472 TGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGA 1531 

I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 1604 TCCCTCGAGACCCCAGCAGCAGTGTCAGTGGCACCTTTGGTTGCCTGGGTGGGAGGCTGA 1663 

Qy 1532 TGATCCCTAATACAGGTATCAGCCT CCT CATCCCCCCAGAT GCCATACCCCGAGGGAAGA 1591 

Mil I I I I I I I I I I I I I III I I I I I I I I I I I I I I I 

Db 1664 CCATTCCCGGCACAGGGGTCAGCCTGTTGGTACCAAATGGAGCCATTCCCCAGGGCAAGT 1723 

Qy 1592 T CT AT GAGAT CT ACCT C ACGCT GC ACAAGC CGGAAGAC GTGAGGTT GCC C CT AGCT GGCT 1651 

I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 1724 TCT AT GACTT GT AT CT AC GT AT CAACAAGACT GAAAGCACC CT C CC ACTT T CGGAAGGTT 1783 

Qy 1652 GTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGC 1711 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I - 
Db 1784 CCCAGACAGTATTGAGCCCCTCGGTGACCTGCGGGCCCACGGGCCTCCTCCTGTGCCGCC 1843 

Qy 1712 CAGT CAT CCT GGCT AT GGAC CACT GT GGGGAGCC CAGC C CT GACAGCT GGAGC CT GCGC C 1771 

III I I I I I I I I I I I I I I II II II II I I I I I I I I I 

Db 1844 CTGTTGTCCTCACTGTGCCCCACTGTGCTGAAGTCATTGCCGGAGACTGGATCTTCCAGC 1903 

Qy 1772 TCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGC 1831 

I I I I I I I I I I I I I I I I I I I I I I I I II I I III I I I I I I I I 

Db 1904 TCAAGACCC AGGCC CAT C AGGGC CACT GGGAGGAGGT GGTGACTTT GGAT GAGGAGACT C 1963 

Qy 1832 CCT CCCACCT CT ACTACT GC C AGCT GGAGGC C AGT GC CT GCT AC GT CT T CAC CGAGCAGC 1891 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1964 TGAACACCCCCTGCTACTGCCAGCTAGAGGCTAAATCCTGCCACATCCTGTTGGACCAGC 2023 

Qy 1892 TGGGCCGCTTTGCCCTGGTGGGAGAGGC CCT CAGC GT GGCT GCCGCCAAGCGCCTCAAGC 1951 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2024 TGGGTACCTACGTGTTCACGGGCGAGTCCTACTCCCGCTCCGCAGTCAAGCGGCTCCAGC 2083 

Qy 1952 TGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCC 2011 

I I I I I I I I I II II I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 2084 TAGCCATCTTCGCCCCAGCCCTCTGCACCTCCCTGGAGTATAGTCTCAGGGTCTACTGTC 2143 

Qy 2012 TGCATGACACCCACGATGCACTCAAGGAGGTGGTGCAGCTGGAGAAGCAGCTGGGGGGAC 2071 

I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 2144 T GGAGGACACT C CT GCAGCACTGAAGGAGGT C CT AGAGCTGGAGAGGACT CT GGGT GGCT 2203 

Qy 2072 AGCT GAT CC AGGAGCC AC GGGT CCT GC ACT T CAAGGAC AGTT ACCACAAC CT GCGC CT AT 2131 

I III I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 2204 ACT T GGT GGAGGAGCCCAAGACT T T GCT CT T TAAGGAC AGTT ACCACAAC CTACG - CT CT 2262 

Qy 2132 CCAT CCACGAT GT GCCCAGCT CC CT GT GGAAGAGTAAGCTCCTT GT CAGCT AC CAGGAGA 2191 

It I I I I II I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2263 CC CT C CATGACAT CCCC C AT GCC CACT GGAGGAGCAAAC TACT GGCCAAGT AC CAGGAGA 2322 

Qy 2192 TCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGG 2251 

I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I 

Db 2323 TTCCCTTCTACCATGTGTGGAACGGCAGCCAGAAAGCCCTGCACTGCACTTTCACCCTGG 2382 



Qy 2252 AGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGG 2311 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 

Db 2383 AGAGACAT AGC CTAGCCT CCACT GAGTTCACCT GTAAGGT CTGC GT GCGGCAGGT AGAAG 2442 

Qy 2312 GC GAC GGGCAGAGCTT CAGCAT CAACT TCAACAT C AC CAAGGACACAAGGT TT GCT G 2368 

I I I M I I I I I I I I I I I I II II III I 

Db 2443 GGGAAGGCCAGATTTTCCAGCTGCACACCACGCTGGCTGAGACGCCTGCTGGCTCCCTGG 2502 

Qy 2369 AGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCA 2428 

I M I II I III I I I I I II I I I I I I I I I I I 

Db 2503 AT GCACT CT GCT CTGC CC CTGGCAAT GCT GCCAC CAC ACAGCT GGGACCCT ATGC CT T CA 2562 

Qy 2429 AGAT C CCCTT CCT CATT CGGCAGAAGATAATT T C CAGC CT GGACCCACC CT GTAGGCGGG 24 88 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2563 AGATACCACTGTCCATCCGCCAGAAGATCTGCAACAGCCTGGACGCCCCCAACTCACGGG 2622 

Qy 2489 GTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCATCTCAGCTTCTTTG 2548 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2623 GCAAT GACT GGC GGCT GT T GGC ACAGAAGCTCT C CAT GGACCGGT ACCT GAACT ACT T CG 2682 

Qy 2549 CCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCA 2608 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I 
Db 2683 C CAC CAAAGCT AGT C C CACAGGC GT GAT CTTAGAC CT CT GGGAAGCT C GGC AGC AGGAT G 2742 

Qy 2609 ACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCC 2668 

III I I I I I I I I I I I I II III I I I I I I I I II 

Db 2743 AT GGGGACCT CAACAGCCT GGCCAGT GC CTTGGAGGAGAT GGGCAAGAGT GAGAT GCT GG 2802 

Qy 2669 T CTT CACAGT GT C GGAGGCTGAGT GCT GA 2697 

I II I I I I I I I I I I I I 

Db 2803 TAGCCAT GACCACTGATGGCGATTGCT GA 2831 
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Qy 440 TGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCG 499 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 10 T ACGGAAGACATTT GAGCAGGAACCCCT AGGAAAGGAAGT GT CTTT GGAACAGGAAGTCT 69 

Qy 500 TGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACG 559 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 70 TACT C CAGT GT CGACCACCT GAAGGGATCC CAGT GGCT GAGGT GGAATGGTTGAAAAAT G 129 

Qy 560 AGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATCACGCGGGAGCACAGCCTGG 619 

Mill I I I I I III I I I I I I I I I I I I I I I I I I I 

Db 130 AAGACATAATTGAT C CCGTT GAAGATCGGAATT TTT AT ATT ACT ATT GAT CACAAC CT CA 189 

Qy 620 T GGT GCGAC AGGCC C GCCTT GCT GACAC GGCCAACTACACCT GC GT GGCCAAGAACAT CG 679 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 190 T CATAAAGC AGGCCC GACT CT CT GATACT GCAAATT AC ACCT GT GTT GCCAAAAACATTG 249 

Qy 680 TGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGA 739 

III I II I III I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 250 T T GC CAAGAGGAAAAGT ACAACT GC CACTGT CAT AGT CT AT GT CAACGGT GGCT GGT CCA 309 

Qy 740 CGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCC 799 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 310 C CTGGACGGAGTGGT CT GTGTGTAACAGCC GCT GT GGACGAGGGT AT C AGAAAC GT ACAA 369 

Qy 800 GGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCC 859 

III II I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I III I 
Db 370 GGACTTGTACCAACCCGGCACCACTCAATGGGGGTGCCTTCTGTGAAGGGCAGAGTGTGC 429 

Qy 860 AGAAAACAGC CT GC GCCACCCT GT GCCCAGT AGAC GGCAGCT GGAGC C CGT GGAGCAAGT 919 

I I I I I I I I II II III I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 430 AGAAAAT AGC CT GTACT ACGT TAT GCCCAGT GGAT GGC AGGT GGACGC CAT GGAGCAAGT 489 

Qy 920 GGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCAGCAC 979 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 490 GGTCT ACTT GT GGAACT GAGT GCACCCACT GGC GCAGGAGGGAGT GCACGGCGC C AGC CC 549 

Qy 980 CCCGCAACGGAGGGGAGGAGT GC CAGGGCACT GAC CT GGAC AC CC GCAACT GT ACCAGTG 1039 

II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II 

Db 550 CCAAGAATGGAGGCAAGGACTGCGACGGCCTCGT CTTGCAATCCAAGAACT GCACT GATG 609 

Qy 1040 ACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGG CCTCA 1096 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II 
Db 610 GGCT T TGCAT GC AGACT GCT C CT GATT C AGAT GAT GTT GCT CT CT AT GTT GGGATT GT GA 669 

Qy 1097 TCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGA 1156 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II 

Db 670 TAGCAGTGATCGTTTGCCTGGCGATCTCTGTAGTTGTGGCCTTGTTTGTGTATCGGAAGA 729 

Qy 1157 AGAAGGAGGGGCT GGACT CAGAT GT GGCTGACT C GTCC AT T CT CAC CT CAGGCT T CCAGC 1216 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



730 ATCAT C GT GACTTT GAGT CAGAT ATTAT TGACT CTT CGGCACT CAATGGGGGCTTTCAGC 789 

1217 CCGTCAGCAT CAAGC CCAGCAAAGCAGACAACC C C CAT CT GCT CACCATCCAGCCGGACC 1276 

I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I 

790 CT GT GAAC AT CAAG GC AGCAAGACAAGAT CT GCT GGCTGTAC CCCCAGACC 840 

1277 T CAGC AC CACCACC ACC ACCT ACC AGGGCAGT CT CT GT CC C CGGCAGGAT G GGCC 1331 

II I I I I III III II I I I I I I I I I I I I I I II 
T C ACGT CAGCT GCAGC C ATGT ACAGAGGACCT GT CT AT GCCCT GCAT GACGTCT CAGACA 900 



841 



1332 



901 



CAGC C CCAAGTT CCAGCT CACCAAT GGGCACCTGCTCAGCCCCCTGGGTGGCGGCC 1387 

I I I II I I I I I I I I I I I I I I I I I I I I I I I 

AAAT CCCAAT GAC CAACT CT C CAATT CT GGAT CC ACT GCC CAACCT GAAAATCAAAGT GT 960 



1388 GCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCT 1447 
I I I I I I I I I I III I I I I I I III III 

ACAAC ACCT CAGGT GCT GT CAC C C CCCAAGAT GAC CT CT CT GAGT TT ACGT CCAAGCT GT 1020 



961 



1495 



1448 CCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGA 

I I I I I I I I I II I II I I I I I I 

1021 C C C CT CAGAT GACC CAGT CGTT GT T GGAGAATGAAGC C CT CAGCCT GAAGAACCAGAGTC 1080 



1496 



1525 



CCTATGGGACCTTCAACTTCCTCGGGGGCC 

I I I I I I I I I I I I I I I I I I I I I 
1081 T AGCAAGGCAGACT GAT C CAT C CT GT AC CGCATTT GGCAGCTT CAACT CGCTGGGAGGT C 1140 



1526 



1585 



GGCTGATGATCCCTAATACAGGTAT CAGCCTCCT CATCCCCCCAGAT GCCATACCCCGAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
1141 ACCTTATTGTTCCCAATTCAGGAGTCAGCTTGCTGATTCCCGCTGGGGCCATTCCCCAAG 1200 

1586 GGAAGAT CT AT GAGATCT ACCT C ACGCT GC ACAAGCCGGAAGAC GT GAGGTTGCC CCT AG 1645 

III I I I I I I I I I I III I I I I I I III I I I I I I I I I I 

1201 GGAGAGTCT AC GAAATGT AT GT GACT GT ACACAG GAAAGAAACT AT GAGGC CACC CAT GG 1260 

1646 CTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCA 1705 
I I I I I I I I I I I I III II I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATGACTCTCAGACACTTTTGACCCCTGTGGTGAGCTGTGGGCCCCCAGGAGCTCTGCTCA 1320 



1765 



1261 



1706 CC CGGCCAGT CAT C CT GGCT AT GGACCACT GTGGGGAGCC CAGCC CT GACAGCT GGAGC C 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I III I I I I I 

1321 CC CGCCCAGT CGT C CTCACT AT GC ATCACT GC GC AGACCC CAAT AC CGAGGACT GGAAAA 1380 

1766 TGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGG 1825 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
1381 TACT GCT CAAGAAC CAGGCAGCACAGGGACAGT GGGAGGAT GT GGT GGT GGTCGGGGAGG 144 0 

1826 AGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCG 1885 

I III I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

1441 AAAACTT CAC CACC C CCT GCT AC AT TCAGCT GGAT GCAGAGGC CT GC C AC AT C CT C ACAG 1500 

1886 AGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCC 1945 

I I I I I M II I I I I I I I I I I I I II III I I I I I I I I I I I I I 
1501 AGAACCTCAGCACCTACGCCCTGGTAGGACATTCCACCACCAAAGCGGCTGCGAAGCGCC 1560 

1946 TCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCT 2005 

II I I I I II I Mil III II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 TCAAGCTGGCCATCTTTGGGCCCCTGTGCTGCTCCTCGCTGGAGTACAGCATCCGAGTCT 1620 



Qy 

Db 



2006 ACT GC CT GCAT GACACC C ACGAT GC ACT CAAGGAGGT GGT GCAGCTGGAGAAGCAGCT GG 2065 

I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 ACT GT CT GGAT GACACC CAGGAT GC C CT GAAGGAAATTTT ACAT CTT GAGAGACAGAT GG 1680 



Qy 2066 GGGGACAGCT GAT C C AGGAGCC AC GGGT CCT GCACTT CAAGGACAGT TACCACAAC CT GC 2125 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 GAGGACAGCT C CT AGAAGAACCTAAGGCTCTT CAT TT TAAAGGCAGCAC C CACAACCT GC 1740 

Qy 2126 GC CTATC CAT CC ACGAT GTGCCCAGCT CCCT GT GGAAGAGTAAGCTCCTT GTCAGCT ACC 2185 

I I I I I I I I I I I II I I II I I I I I I I I I II I I I I I I I I I III 
Db 1741 GCCT GTCAATT CAC GAT ATCGC C CAT T CCCT CT GGAAGAGCAAATTGCTGGCTAAAT ATC 1800 

Qy 2186 AGGAGAT C CC CTTT T AT C ACAT CT GGAATGGCAC GCAGCGGT ACTTGC ACT GCACCTT CA 2245 

I I I I I I I I I I I II I I I I I I I I I I III I I I I I I I I I I I I I I I I I I 
Db 1801 AGGAAATT CCATTTT ACCAT GT TT GGAGTGGAT CT CAAAGAAACCT GCACT GCACCTT CA 1860 

Qy 2246 CCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGG 2305 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1861 CTCTGGAAAGATTTAGCCTGAACACAGTGGAGCTGGTTTGCAAACTCTGTGTGCGGCAGG 1920 

Qy 2306 T GGAGGGC GACGGGC AGAGCT T CAGC AT CAACT T CAACAT CACCAAGGACACAAGGTTT G 2365 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1921 T GGAAGGAGAAGGGCAGAT CT TCCAGCT CAACT GCAC CGT GTCAGAGGAACCT ACT GGCA 1980 

Qy 2366 CTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCT 2425 

II I I I I I I I I I II III I I I I I I I I I I I I I I 

Db 1981 TCGATTTGCCGCTGCTGGATCCTGCGAACACCATCACCACGGTCACGGGGCCCAGTGCTT 2040 

Qy 2426 T CAAGAT CCC CTT C CT CATT CGGC AGAAGATAAT T T CC AGC CT GGAC C CAC CCTGT AGGC 2485 

III I I I I I III I I I I I I I I I II I I I I I I I I I I I I I I I II 
Db 2041 T CAGCAT CCCTCTCC CT ATCC GGC AGAAGCT CT GT AGCAGC CT GGAT GCC C CC CAGACGA 2100 

Qy 2486 GGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCATCTCAGCTTCT 2545 

III I I I I I I I II I I II I I I I I I I I I I I I I I I II I I II III 

Db 2101 GAGGCCAT GACT GGAGGATGCT GGCC CAT AAGCT GAACCT GGACAGGT ACTTGAATT ACT 2160 

Qy 254 6 TTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCC 2605 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 TTGCCACCAAATCC AGC CCAACTGGCGTAAT CCT GGAT CTTT GGGAAGCACAGAACTTCC 2220 

Qy 2606 CCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTG 2665 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II II 

Db 2221 CAGAT GGAAAC CT GAGCATGCT GGCAGCT GT CTT GGAAGAAAT GGGAAGACAT GAAACGG 2280 

Qy .2666 GC CT CTT CACAGT GT C GGAGGCT GAGT GCT GA 2697 

III II I I I I III II 
Db 2281 TGGTGTCCTTAGCAGCAGAAGGGCAGTATTAA 2312 
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FILE REFERENCE: LEX-0244-USA 
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US-09-969-532-9 
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Matches 1305; Conservative 0; Mismatches 1230; Indels 30; Gaps 5; 

Qy 127 CTTC C CCACTT C CT GGT GGAGCC CGAGGAT GT GT AC AT CGT CAAGAACAAGCC AGT GCT G 186 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 157 CT GC CTC ATTT CAT AGAGGAGCC AGAT GAT GCTT AT AT TAT CAAGAGCAACCCT AT T GCA 216 

Qy 187 CTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTG 246 

II I II I I I II III I I I I MINI I I I I I I I I I I I I I I II I I I I I I I I 

Db 217 CT CAGGT GCAAAGCGAGGCCAGC CAT GCAGAT ATT CTT CAAAT GCAAC GGC GAGT GGGTC 276 

Qy 247 C GCCAGGT GGACC AC GT GAT C GAGC GCAGCACAGAC GGGAGCAGT GGGCT GCC CAC CATG 306 

I I I I I I I I I I I II I II I I I I I I II II I 

Db 277 CATCAGAACGAGCACGTCTCT GAAGAGACTCTGGACGAGAGCT CAGGTTT GAAGGT CCGC 336 

Qy 307 GAGGT CC GCATTAAT GT CT CAAGGC AGC AGGT CGAGAAGGT GT T C GGGCT GGAGGAAT AC 366 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 337 GAAGT GT T CAT CAAT GTT ACT AGGCAAC AGGT GGAGGACTT CCAT GGGCCC GAGGACT AT 396 

Qy 367 TGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCCTACATC 426 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 397 TGGTGCCAGTGTGTGGCGTGGAGCCACCTGGGTACCTCCAAGAGCAGGAAGGCCTCTGTG 456 

Qy 427 CGCATAGCCAGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTG 486 

MINIMI I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 457 CGCATAGCCTATTT ACGGAAAAACTTT GAACAAGACCCACAAGGAAGGGAAGTT CCCATT 516 

Qy 487 GAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAG 54 6 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 517 GAAGGCAT GAT T GT ACT GCACT GC CGCC CAC CAGAGGGAGT CC CT GCT GC CGAGGTGGAA 576 

Qy 547 TGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATCACGCGG 606 

I I I I I I I I I I I I I I I I I I III II I Ml II I 

Db 577 TGGCTGAAAAATGAAGAGCCCATTGACT CTGAACAAGACGAGAACATT GACACCAGGGCT 636 

Qy 607 GAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTG 666 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 637 GACCAT AAC CT GAT CAT C AGGCAGGCAC GGCT CT C GGACT C AGGAAAT T AC AC CT GCAT G 696 

Qy 667 GCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAAC 726 

II I I II I I I I I I I I I I I I II I I MM I I M I I I II I I 
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697 GCAGCCAACATCGTGGCTAAGAGGAGAAGCCTGTCGGCCACTGTTGTGGTCTACGTGGAT 756 

727 GGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGG 786 

II I II I I I I I I I I I I I I I I I I I I I I II I I I I I I 
757 GGGAGCT GGGAAGT GT GGAGC GAAT GGT C C GTCTGCAGT CCAGAGTGT GA A 807 

787 CAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAG 846 

II I I I I I I I I I II I I II III I I I I I I I I I I I I I II I 

808 C ATT T GC GGAT CCGGGAGT GCACAGCAC CACCC CC GAGAAAT GGGGGCAAATT CTGT GAA 867 

847 GGGCAGAAT GTC CAGAAAACAGCCT GCGCCACCCT GTGC CC AGT AGAC GGCAGCTGGAGC 906 

I I I I I I I I I I I I II 

868 GGT CT AAGCC AGGAAT CT GAAAACT GCAC AGAT GGT CTT T GCAT C CT AGAT AAAAAAC CT 927 

907 CCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGC 966 

I I I I I I II I II IN 

928 CTT CAT GAAATAAAACCCCAAAGCATT GAGAAT GC C AGC GAC ATT GCT TT GT ACTCGGGC 987 

967 T CT GAC C CAGCACCC C GCAACGGAGGGGAGGAGTGC CAGGGCACT GACCT GGACACC CGC 1026 

II III I I I I I II II I I I I I I I I 

988 TTGGGTGCTGCCGTCGTGGCCGTTGCAGTCCTGGTCATTGGTGTCACCCTTTACAGACGG 1047 

1027 AACT GT ACCAGT GAC CT CT GT GT AC ACAGT GCTT CT GGC C CT GAGGAC GT G GC C CT CTAT 1086 

II I I I I I I I I I I I I I I I I I I I 

104 8 AGC CAGAGT GACT AT GGC GT GGAC GT CATT GACT CT T CT GCATT GAC AGGT GGCTT CCA- 1106 

1087 GTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTT 1146 

I I I I I I I I I I I I I II I I II I I I I I 

1107 — GACCT T CAACTTCAAAACAGT C C GT CAAGC CAAGAAT AT CAT GGAACTAAT GAT ACAA 1164 

1147 TATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCTCA 1206 

I I I I I I II II II I II I I 

1165 GAAAAAT CCT TT GGT AACT CC CTGCT C CT GAATT CT GCC AT GCAGCCAGAT CT GACAGT G 1224 

1207 GGCTT C CAGCCCGTCAGCAT CAAGC C CAGCAAAGCAGACAACCC C CAT CT GCT C AC CAT C 1266 

II I I I I I II I I I I I I I I 

1225 AGCCGGACAT AC AGC GGACC CAT CT GT CT GCAGGACCCT CT GGACAAGGAGCT CATGACA 1284 

1267 CAGCC GGACCTCAGCAC CAC CAC C ACCAC CT ACCAGGGCAGT CT CTGT CC CCGGCAGGAT 1326 

III III I I I I I I I I I II II 

1285 GAGT C CT CACTCT TTAAC CCT T T GT CGGACAT CAAAGT GAAAGT CC AGAGCTCGTT CATG 1344 

1327 GGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGC 1386 

III I I I I II I I I II I 

1345 GT TT C C CT GGGAGT GT CT GAGAGAGCT GAGT ACCAC GGCAAGAAT CATTCC AGGACTTT T 1404 

1387 CGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTC 144 6 

I I I I I I I I I I I I I I I II I II I I II III 
1405 CCCCATGGAAACAACCACAGCTTTAGTACAATGCAT CCCAGAAATAAAAT GCCCTACATC 1464 

1447 T CCACCCAGAACT ACTTCCGCT CC CT GC C C CGAGGC AC C AGCAACAT GAC CTAT GGGAC C 1506 

III II I I I II I I I I I III II I I 

1465 CAAAATCTGTC AT CACT CC C CACAAGGAC AGAACT GAGGACAACT GGT GT C 1515 

1507 TTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCC 1566 

II I I I I III I I I I I I I I I I I I I I I I Ill II 

1516 TTTGGCCATTTAGGGGGGCGCTTAGTAATGCCAAATACAGGGGTGAGCTTACTCATACCA 1575 



Qy 1567 CCAGAT GC C AT ACCC C GAGGGAAGAT CT AT GAGATCT AC CT C ACGCT GC ACAAGC CGGAA 1626 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 1576 CACG GT GCCAT CCC AGAGGAGAATT CTT GGGAGATTT AT AT GT CCAT CAACCAAGGT 1632 

Qy 1627 GACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGA 1686 

II II II I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 1633 GAACC CAGCCT C CAGT CAGATGGCT CT GAGGT GCT CCT GAGT C CT GAAGT CACCT GT GGT 1692 

Qy 1687 CCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCC 1746 

I I I I I I I I I I I II II I I I I I I I I I I I I I II I 

Db 1693 C CT CCAGACAT GATCGTCACCACT CCCT T T GCATTGAC CAT C C CGC ACT GT GCAGATGT C 1752 

Qy 1747 AGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGAT 1806 

II I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I 

Db 1753 AGT T CT GAGCAT T GGAAT AT C CAT TTAAAGAAGAGGACAC AGCAGGGCAAAT GGGAGGAA 1812 

Qy 1807 GTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGT 1866 

I I I I I III I I I I I III II I I I I I I I I I I I II I 

Db 1813 GT GAT GT CAGT G GAAGAT GAAT CT AC AT C CTGTTACTGCCTTTTGGACCCCTTT 1866 

Qy 1867 GCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGC 1926 

I I I I I I I II II III II I I I I I I I I I I I I III 

Db 1867 GC GTGT CATGT G CT C CT GGACAGCTTT GGGACCT AT GC GCT CACT GGAGAGC CAAT C ACA 1926 

Qy 1927 GTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTC 1986 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 1927 GACTGTGCCGTGAAGCAACTGAAGGTGGCGGTTTTTGGCTGCATGTCCTGTAACTCCCTG 1986 

Qy 1987 GAGT ACAACAT CCGGGT CT ACTGC CTGCAT GACACCCACGAT GCACT CAAGGAGGT GGT G 2046 

I I I I I I I I I I I I I I I I I III I II I I I I I I I I I I I I I I I I 

Db 1987 GATT ACAACT T GAGAGTTT ACTGT GT GGACAAT ACC CCTT GT GC ATT T CAGGAAGT GGTT 204 6 

Qy 2047 CAGCT GGAGAAGCAGCT GGGGGGACAGCT GAT C C AGGAGC C ACGGGT CCT GCACTT CAAG 2106 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2047 TCAGATGAAAGGCATCAAGGT GGACAGCTCCTGGAAGAACCAAAATT GCTGCATTTCAAA 2106 

Qy 2107 GACAGTT AC CACAAC CTGCGC CT AT CCAT CCAC GAT GT GCC CAGCT C CCT GT GGAAGAGT 2166 

I II I I III III III I I I I I I I I I I I I I I I II 

Db 2107 GGGAATACCTTTAGT CTT CAGATTTCTGT CCTT GATATTCCCCCATT CCT CTGGAGAATT 2166 

Qy 2167 AAGCT C CTTGT CAGCT ACCAGGAGATC CCCTTTT AT CACAT CT GGAAT G GCACGCAGCGG 2226 

II I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 2167 AAACCATTCACT GCCTGCCAGGAAGTCCCGTTCTCCCGC GTGT GGT GCAGTAACCGGCAG 2226 

Qy 2227 TACTT GCACT GC ACCT T CAC C CT GGAGC GT GT CAGCC CC AGCACT AGT GAC CTGGC CT GC 2286 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I III I I I I I I I I I 

Db 2227 CCCCTGCACTGTGCCTTCTCCCTGGAGCGTTATACGCCCACTACCACCCAGCTGTCCTGC 2286 

Qy 2287 AAGCT GT GGGT GTGGCAGGTGGAGGGCGACGGGCAGAGCTT CAGCAT CAACTTCAACATC 2346 

II III I I I I I I I I I I I I I II I I I II I I III 

Db 2287 AAAAT CT GC ATT CGGCAGCT CAAAGGC CAT GAAC AGAT C CT C CAAGT GC AGACAT CAATC 2346 

Qy 2347 ACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCC 2406 

II II I I I II I I I I I I 

Db 2347 CT AGAGAGTGAACGAGAAACCAT C ACT TT CTT C GCACAAGAGGACAGCACTT TCC CT GCA 2406 



Qy 2407 CTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGC 2466 

II I I I I I I I I I I I I I I I I I I I I I I III I I I I III III 
Db 2407 C AGACT GGC CC CAAAGC CT T CAAAATTCC CT ACT CCATCAGAC AGC GGATTT GTGCTACA 24 66 



Qy 2467 CTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTG 2526 

III I I I I I II I I I I I I I I I I I I II I I I I I II 

Db 2467 TTTGATACCCCCAATGCCAAAGGCAAGGACTGGCAGATGTTAGCACAGAAAAACAGCATC 2526 

Qy 2527 GACAGCCAT CT CAGCT T CTTT GC CT C CAAGCCCAGCC C CAC AGCCAT GAT C CT CAACCT G 2586 

I I I I III I I I I I I I I I I I I III III I I I I I I I 

Db 2527 AACAGGAATTTATCTTATTTCGCTACACAAAGTAGCCCATCTGCTGTCATTTTGAACCTG 2586 

Qy 2587 TGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGA 2646 

I I I I I I I I I I I I III III I I I II I II II I 

Db 2587 TGGGAAGCTCGTCATCAGCATGATGGTGATCTTGACTCCCTGGCCTGTGCCCTTGAAGAG 2646 

Qy 2647 CTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAG 2691 

III I I I I I I I II I I I I I I I I II 

Db 2647 ATT GGGAGGACACAC ACGAAACT CT CAAACATTT CAGAATC C C AG 2691 



RESULT 9 

US-09-969-532-33 

; Sequence 33, Application US/09969532 

; Patent No. 6777232 

; GENERAL INFORMATION: 

; APPLICANT: Walke, D. Wade 

; APPLICANT: Scoville, John 

; TITLE OF INVENTION: No. 6777232el Human Membrane Proteins and Polynucleotides 

Encoding the Same 

; FILE REFERENCE: LEX-0244-USA 

; CURRENT APPLICATION NUMBER: US/09/969,532 

; CURRENT FILING DATE: 2001-10-02 

; PRIOR APPLICATION NUMBER: US 60/237,280 

; PRIOR FILING DATE: 2000-10-02 

; NUMBER OF SEQ ID NOS : 33 

; SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 33 

LENGTH: 3411 

TYPE: DNA 
; ORGANISM: homo sapiens 
US-09-969-532-33 

Query Match 18.1%; Score 487; DB 4; Length 3411; 

Best Local Similarity 50.9%; Pred. No. 4.4e-101; 
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Qy 127 CT T C C CCACT T C CT GGT GGAGC C CGAGGAT GT GT AC AT CGT CAAGAACAAGC CAGT GCT G 186 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 271 CT GC CT CAT TT CAT AGAGGAGCC AGAT GAT GCTT AT ATT AT CAAGAGCAAC C CT ATT GC A 330 

Qy 187 CTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTG 246 

II I I I I II II III I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I 

Db 331 CTCAGGTGCAAAGCGAGGCCAGCCATGCAGATATTCTTCAAATGCAACGGCGAGTGGGTC 390 

Qy 247 CGCCAGGT GGACC ACGT GAT CGAGC GCAGCACAGAC GGGAGCAGT GGGCT GC C CAC CAT G 306 

I III I I I I I I I II I I I I I I I I I II II I 



Db 391 CAT CAGAACGAGCACGT CT CT GAAGAGACTCT GGACGAGAGCTC AGGTTT GAAGGT C C GC 450 

Qy 307 GAGGTCCGCATTAAT GTCT CAAGGC AGC AGGT CGAGAAGGT GTTC GGGCT GGAGGAAT AC 366 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 451 GAAGT GTTC ATCAAT GTT ACT AGGCAACAGGT GGAGGACTT CCAT GGGCC C GAGGACT AT 510 

Qy 367 T GGT GC C AGT GCGTGGC AT GGAGCT C CT C GGGCAC CAC CAAGAGT CAGAAGGC CT ACAT C 426 

I I I II II I I II I I II I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I 
Db 511 TGGTGCCAGTGTGTGGCGTGGAGCCACCTGGGTACCTCCAAGAGCAGGAAGGCCTCTGTG 570 

Qy 427 CGC AT AGCC AGATT GCGCAAGAACT T C GAGC AGGAGCC GCT GGC CAAGGAGGT GTC CCT G 486 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 571 CGCAT AGCCT AT TTACGGAAAAACT T T GAACAAGAC C CACAAGGAAGGGAAGTT CC CATT 630 

Qy 487 GAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAG 546 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I. I I I I I I I I I I I I 

Db 631 GAAGGC ATGATT GT ACT GC ACT GC CGCC CACCAGAGGGAGT C CCT GCT GCC GAGGT GGAA 690 

Qy 547 T GGCTC C GGAACGAGGAC CT GGT GGACC C GT C CCT GGACCC CAAT GT AT ACAT CAC GCGG 606 

I I I I I I I I I I I I I I I I I I III II I I I I I I I 

Db 691 T GGCTGAAAAAT GAAGAGC C CAT T GACT CT GAACAAGAC GAGAACATT GACAC C AGGGCT 750 

Qy 607 GAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTG 666 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 751 GAC CAT AAC CTGAT CATC AG GC AGGC AC GGCT CT C GGACTC AGGAAATTAC AC CT GC AT G 810 

Qy 667 GCCAAGAACAT C GTGGCACGT C GC C GCAGC GCCT C CGCT GCT GT CAT C GT CT ACGT GAAC 726 

II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 811 GCAGCCAACATC GTGGCTAAGAGGAGAAGC CT GT C GGC C ACT GTT GT GGT CTACGT GGAT 870 

Qy 727 GGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGG 786 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 871 GGGAGCT GGGAAGTGT GGAGC GAAT GGT CC GT CT GCAGT CCAGAGT GT GA A 921 

Qy 787 CAGAAACGGAGCC GGAGCT GCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGT GAG 846 

II I I I I I I I I I I I I I II III I I I I I I I I I I I I I I I I 

Db 922 CATTT GC GGATCCGGGAGT GCACAGCACCACCCC C GAGAAAT GGGGGCAAATT CT GT GAA 981 

Qy 847 GGGCAGAAT GTC CAGAAAACAGCCT GC GCCAC CCT GT GC CCAGTAGACGGCAGCT GGAGC 906 

I I I I I I I I I I I I II 

Db 982 GGT CTAAGCCAGGAAT CT GAAAACT GCACAGAT GGT CTT T GCAT C CT AGATAAAAAAC CT 1041 

Qy 907 CCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGC 966 

I I I I I I I I I I I III 

Db 1042 CTT CAT GAAATAAAAC CC CAAAGCATT GAGAAT GCC AGCGAC ATT GCTTT GT ACTCGGGC 1101 

Qy 967 T CT GACC C AGCACCC C GCAAC GGAGGG GAGGAGT GC C AGGGC ACT GAC CT GGACAC C CGC 1026 

II III I I I I I II II I I I I I I I I 

Db 1102 TTGGGTGCTGCCGTCGTGGCCGTTGCAGTCCTGGTCATTGGTGTCACCCTTTACAGACGG 1161 

Qy 1027 AACT GT ACC AGT GAC CTCT GT GT ACACAGT GCT T CT GGC CCT GAGGAC GT GGC C CT CTAT 1086 

II I I I I I I I I I II I I I I I I I I 

Db 1162 AGC CAGAGT GACT AT GGCGT GGAC GT CATT GACT CTTCT GC ATT GACAGGT GGCTT C CA- 1220 

Qy 1087 GTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTT 1146 

I I III I I I III I I I I I I I I II II I 

Db 1221 — GAC CTT C AACT T C AAAAC AGT C C GT C AAG C C AAGAAT AT CAT G GAACT AAT GAT ACAA 1278 
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1147 T ATT GCC GGAAGAAGGAGGGGCT GGACT CAGAT GT GGCTGACTC GT C CATTCT C ACCT CA 1206 

I I I I I I II I I I I I I I I I 

1279 GAAAAAT C CTTT GGTAACT C CCT GCT C CTGAATT CT GCC AT GCAGCCAGAT CT GACAGT G 1338 

1207 GGCTT CCAGC CCGT CAGCAT CAAGC CCAGCAAAGCAGACAACC CCC AT CT GCT CACCAT C 1266 

II I I I I I II I I I I I I I I 

1339 AGCCGGACAT ACAGCGGACCCATCTGTCTGCAGGACCCTCT GGACAAGGAGCT CATGACA 1398 



1267 



1326 



CAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGAT 
III III III I I I I I I II II 

1399 GAGT CCT C ACT CTTTAACCCTTT GT C GGACAT CAAAGT GAAAGT CCAGAGCT CGTT CAT G 1458 

1327 GGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGC 1386 

III I I I I II III II I 

1459 GTTT CCCT GGGAGT GTCT GAGAGAGCT GAGT AC CAC GGCAAGAAT CATT CCAGGACTTTT 1518 

1387 C GCCACACACT GC AC CACAGCT CT C C C ACCT CT GAGGC CGAGGAGTT CGT CTCC CGCCTC 1446 

I I I I I I I I I I I I I I I II I II I I II III 

1519 CCCCATGGAAACAACCACAGCTTTAGTACAATGCATCCCAGAAATAAAATGCCCTACATC 1578 

1447 T CC ACCCAGAACT ACTT CCGCT C C CTGC CC CGAGGCACCAGCAACAT GAC CT AT GGGAC C 1506 
III I I I I I I I I I I I I I II III I 

CAAAATCTGTC AT CACT CCCC ACAAGGAC AGAACT GAGGACAACT GGT GT C 1629 



1566 



1579 



1507 TTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCC 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1630 TTTGGCCATTTAGGGGGGCGCTTAGTAATGCCAAATACAGGGGTGAGCTTACTCATACCA 1689 



1567 



1626 



C CAGATGC CAT ACCC CGAGGGAAGAT CT AT GAGAT CT AC CT CACGCT GCACAAGCC GGAA 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

1690 C AC GGT GC C AT CC CAGAGGAGAATT CT T GGGAGATTT AT AT GT CC AT CAACCAAGGT 1746 

1627 GAC GTGAGGTTGCCCCTAGCTGGCTGTCAGAC CCT GCT GAGT CCCATCGTTAGCTGTGGA 1686 

II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1747 GAACCCAGCCTCCAGTCAGATGGCTCTGAGGTGCTCCTGAGTCCTGAAGTCACCTGTGGT 1806 

1687 CCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCC 1746 

I I I I I I I I I I I I I II I I I I I I I I I I I I I II I 
1807 CCTCC AGACAT GAT C GT CAC CACT CCCTTT GCATT GAC CATCCC GC ACTGT GC AGATGT C 1866 

1747 AGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGAT 1806 

II I I I I I I I I II I II I I I II I I I I I I I I I I I I I I 

1867 AGTT CTGAGCAT T GGAATAT C CATTTAAAGAAGAGGACACAGC AGGGCAAATGGGAGGAA 1926 

1807 GTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGT 1866 

I I I I I III I I I I I III II I I I I I I I I I I I II I 

1927 GT GAT GT C AGT GGAAGAT GAAT CTACAT C CTGTTACTGCCTTTTGGACCCCTTT 1980 

18 67 GCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGC 1926 

I I I I III II M III I I I I I I I I I I I I I I III 

1981 GCGTGTCATGTGCTCCTGGACAGCTTTGGGACCTATGCGCTCACTGGAGAGCCAATCACA 2040 

1927 GTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTC 1986 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2041 GACTGTGCCGTGAAGCAACTGAAGGTGGCGGTTTTTGGCTGCATGTCCTGTAACTCCCTG 2100 



Qy 1987 GAGT ACAACAT C CGGGT CT ACT GC CTGCAT GACACCCAC GAT GCACTCAAGGAGGT GGT G 2046 

I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I II I I 

Db 2101 GATTACAACTTGAGAGTTTACTGTGTGGACAATACCCCTTGTGCATTTCAGGAAGTGGTT 2160 

Qy 2047 CAGCT GGAGAAGCAGCT GGGGGGACAGCT GAT CCAGGAGCCAC GGGTCCT GCACTT CAAG 2106 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2161 T C AGAT GAAAGGCAT CAAGGT GGACAGCTCCTGGAAGAACCAAAATT GCT GCATT T CAAA 2220 

Qy 2107 GACAGTT AC C ACAACCT GCGCCT AT CC AT CCACGAT GTGCC CAGCT CC CT GT GGAAGAGT 2166 

I II I I III III III I I I I I I I I I I I I I I I II 

Db 2221 GGGAATACCTTTAGTCTTCAGATTTCTGTCCTTGATATTCCCCCATTCCTCTGGAGAATT 2280 

Qy 2167 AAGCT CCTT GT CAGCT AC CAGGAGATCCCCTTTTAT CACAT CT GGAAT GGCAC GCAGCGG 2226 

III I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 2281 AAACCATTCACTGCCTGCCAGGAAGTCCCGTTCTCCCGCGTGTGGTGCAGTAACCGGCAG 2340 

Qy 2227 TACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGC 2286 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I 
Db 2341 CCCCTGCACTGTGCCTTCTCCCTGGAGCGTTATACGCCCACTACCACCCAGCTGTCCTGC 2400 

Qy 2287 AAGCTGT GGGT GT GGCAGGT GGAGGGC GAC GGGCAGAGCTT CAGC ATCAACTT CAACAT C 2346 

II III I I I I I I I I II I I I I I I I I I I I I III 

Db 2401 AAAATCT GCATTC GGCAGCT CAAAGGCCAT GAACAGAT CCT CCAAGT GCAGACAT CAAT C 2460 

Qy 2347 ACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCC 2406 

II II I I I II I I I I I I 

Db 2461 CT AGAGAGT GAACGAGAAACCAT CACTTT CTT CGCACAAGAGGAC AGCACTTT CCCT GCA 2520 

Qy 2407 CTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGC 2466 

II I I I I I I I I I I I I I I I I I I I I I I III I I I I III III 
Db 2521 CAGACT GGCC CCAAAGC CTT CAAAATT C CCT ACT C CAT CAGACAGCGGATTT GTGCT ACA 2580 

Qy 2467 CTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTG 2526 

III I II I I II I I I I I I I I I I I I I I I I I I I II 

Db 2581 TT T GAT ACC C CCAAT GCCAAAGGCAAGGACT GGC AGAT GTT AG C ACAGAAAAACAGCAT C 264 0 

Qy 2527 GACAGCCAT CT CAGCT T CTTT GCCT CCAAGCC CAGCCC C ACAGC C AT GAT C CT CAAC CT G 2586 

I I I I III I I I I I I I I I I I I III III I II I II I 

Db 2641 AACAGGAAT T TAT CT T ATTT CGCT ACACAAAGTAGC C CAT CT GCT GT CAT T T T GAAC CT G 2700 

Qy 2587 TGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGA 264 6 

I I I I I I I I I I I I III III I I I I I I II II I 

Db 2701 T GGGAAGCT CGT CAT CAGCAT GAT GGT GAT CTTGACT C CCT GGC CT GT GC C CT T GAAGAG 2760 

Qy 2647 CTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAG 2691 

III I M M I II I I I I I I I I I || 

Db 2761 ATT GGGAGGAC ACAC AC GAAACT CT CAAACATTT C AGAATC C C AG 2805 
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Qy 127 CTT CCCCACTT CCT GGT GGAGC CC GAGGAT GT GT AC ATCGTCAAGAACAAGCCAGT GCT G 186 

I I I I II I I I I I I I i I I I I I I I I I I I I I I I I II I I I I I I I 

Db 157 CTGCCTCATTTCATAGAGGAGCCAGATGATGCTTATATTATCAAGAGCAACCCTATTGCA 216 

Qy 187 CTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTG 246 

II I I I I I I II III I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 217 CT CAGGTGCAAAGC GAGGCC AGC CAT GCAGAT ATTCT TCAAAT GCAACGGC GAGT GGGT C 276 

Qy 247 CGC CAGGT GGAC CAC GT GAT C GAGCGCAGCACAGACGGGAGCAGT GGGCT GCCC ACCAT G 306 

I III I I I I I I I II I I I I I I I I I II II I 

Db 277 CAT CAGAACGAGC AC GT CTCT GAAGAGACT CT GGACGAGAGCT CAGGT TT GAAGGT C C GC 336 

Qy 307 GAGGT CC GC ATTAAT GT CT CAAGGCAGCAGGT CGAGAAGGT GTT CGGGCT GGAGGAAT AC 366 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 337 GAAGT GTT CAT CAAT GT T ACT AGGCAACAGGTGGAGGACT T C C AT GGGC C CGAGGACT AT 396 

Qy 367 TGGTGC CAGT GCGT GGCAT GGAGCT CCT CGGGCACC ACCAAGAGT C AGAAGGCCT ACAT C 426 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 397 TGGTGCCAGTGTGTGGCGTGGAGCCACCTGGGTACCTCCAAGAGCAGGAAGGCCTCTGTG 456 

Qy 427 CGCATAGCCAGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTG 4 86 

I I I I I I I I I II II II I I I I I II II II III I I I I I I I III 

Db 457 CGC AT AGC CT ATTT ACGGAAAAACTTT GAACAAGAC C CACAAGGAAGGGAAGTT C C CATT 516 

Qy 4 87 GAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAG 546 

II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 517 GAAGGCAT GAT T GT ACT GCACT GC CGCCCACCAGAGG GAGT CC CT GCT.GC C GAGGT GGAA 576 

Qy 547 TGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATCACGCGG 606 

I I I I I I I I I I I I I I I I I I III II I I II I I I 

Db 577 TGGCTGAAAAATGAAGAGCCCATT GACTCT GAACAAGACGAGAACATT GACACCAGGGCT 636 

Qy 607 GAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTG 666 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 637 GACCATAAC CT GAT CAT C AGGCAGGCACGGCTCT CGGACT CAGGAAAT T AC ACCT GC ATG 696 

Qy 667 GC CAAGAACAT C GT GGC AC GT CGC C GCAGC GCCT CC GCT GCT GT CAT C GT CT AC GT GAAC 726 

II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 



Db 697 GC AGCCAACAT CGT GGCTAAGAGGAGAAGCCTGT CGGCCACT GTT GTGGT CT AC GTGGAT 756 

Qy 727 GGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGG 786 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 757 GGGAGCTGGGAAGT GT GGAGCGAAT GGT C C GTCT GCAGT C CAGAGT GT G AA 807 

Qy 787 CAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAG 846 

II I I I I I I I I II I I I II III I I I I I II I I I I I I I I I 

Db 808 CATTT GCGGAT CCGGGAGT GCACAGCACC ACCC C CGAGAAAT GGGGGCAAATT CT GT GAA 867 

Qy 847 GGGCAGAAT GT CCAGAAAACAGCCTGCGCCACCCTGT GCCCAGTAGACGGCAGCTGGAGC 906 

I I I I I I I I I I I I I I I I II 

Db 868 GGT CTAAGC CAGGAATCT GAAAACT GC ACAGAT GGT CTTT GCAT C CT AGGCATT GAGAAT 927 

Qy 907 CCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGC 966 

I I I I I I I I I I I I I INI 
Db 928 GCCAGCGACATTGCTTTGTACTCGGGCTTGG GTGC 962 

Qy 967 TCT GAC CCAGCACC C CGCAACGGAGGGGAGGAGT GCC AGGGCACT GAC CTGGACAC C CGC 1026 

I III III III I I I I I I III 
Db 963 TGCCGTCGTGGCCGTTGCAGTCCTGGTCATTGGTGTCACCCTTTACAGACGGA 1015 

Qy 1027 AACTGT ACC AGT GAC CT CT GT GT AC AC AGT GCTT CT GGC C CT GAGGAC GT GGC C CT CT AT 1086 

I I I I I I I I I I I I I III I II 

Db 1016 GC CAGAGT GACT AT GGC GT GGAC GT C ATT GACT CTT CT GCATT GACAGGT GGCT T C 1071 

Qy 1087 GTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTT 1146 

I I I I I I I I I I I I I II I I II I I I I I 

Db 1072 CAGACCTT CAACTT CAAAACAGT C C GT CAAGC CAAGAAT ATC AT GGAACTAAT GAT ACAA 1131 

Qy 1147 TATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCTCA 1206 

I I I I I I I I I I I I I I I II 

Db 1132 GAAAAAT C CTTT GGTAACT C C CT GCT C CTGAAT T CT GCC AT GCAGC C AGAT CT GACAGT G 1191 

Qy 1207 GGCTT C CAGCCCGT C AGCAT CAAGC C CAGCAAAGCAGACAACCCCC AT CT GCT C ACCAT C 1266 

II I I I I I II I I I I I I I I 

Db 1192 AGCCGGACAT ACAGC GGAC CCAT CT GT CTGCAGGACC CTCT GGACAAGGAGCT CAT GACA 1251 

Qy 1267 CAGCC GGAC CT CAGC AC CAC CACCACCACCT AC C AGGGC AGT CT CT GT C C C CGGC AGGAT 1326 

III III III I I I I I I II II 

Db 1252 GAGT C CT CACT CT T TAACC CTTT GT CGGAC AT CAAAGT GAAAGT C CAGAGCT CGT T CAT G 1311 

Qy 1327 GGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGC 1386 

* IN I I I I I I I I I II I 

Db 1312 GTTTCC CT GGGAGT GT CT GAGAGAGCT GAGT AC CAC GGCAAGAAT CAT T C CAGGACTT T T 1371 

Qy 1387 CGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTC 1446 

I I I I I I I I I I I I I I I II III I I I I I I I 

Db 1372 CCCCAT GGAAACAAC CACAGCTTTAGTACAATGCATCCCAGAAATAAAAT GCCCTACATC 1431 

Qy 1447 TC CACCCAGAACT ACT T CCGCT CCCTGC CC CGAGGC ACCAGCAAC AT GAC CT AT GGGACC 1506 

III I I I I II I I I II I I I I III I 

Db 1432 CAAAAT CT GT C ATCACTCCCCACAAGGACAGAACTGAGGACAACTGGTGTC 1482 

Qy 1507 TTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCC 1566 

II I I I I I I I II I I II I I I III I III I III I I I I I I II 

Db 1483 TTTGGCCATTTAGGGGGGCGCTTAGTAATGCCAAATACAGGGGTGAGCTTACTCATACCA 1542 
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1567 



1543 



1627 



C CAGATGC CAT ACC CCGAGGGAAGAT CT AT GAGAT CT ACCT CACGCTGC ACAAGCC GGAA 1626 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CACGGT GCCAT CC C AGAGGAGAATT CTTGGGAGATTTAT ATGT CCAT CAACCAAGGT 1599 



GACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGA 1686 

II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1600 GAAC CCAGC CT CCAGT CAGAT GGCT CT GAGGT GCT C CT GAGT CCT GAAGT CACCTGT GGT 1659 

1687 CCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCC 1746 

I I I I I I I I I I I I I II I I I I II I I I I I I I II I 
1660 CCT CCAGACAT GAT CGT C AC CACT CCCTTT GCATT GAC CAT CC CGCACT GTGC AGATGTC 1719 

1747 AGCC CT GACAGCT GGAGCCT GCGCCTCAAAAAGCAGT C GTGC GAGGGCAGCT GGGAGGAT 1806 

II II I I I II I II I I I I I I II I I I I I I I I I I I I I I 

1720 AGTT CT GAGC AT T GGAAT AT CCATTTAAAGAAGAGGACACAGCAGGGCAAAT GGGAGGAA 1779 

1807 GTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGT 1866 

I I I I I III I I I I I III II I I I I I I I I I I I II I 

1780 GT GAT GT C AGT GGAAGAT GAAT CT AC AT C CTGTTACTGCCTTTTGGACCCCTTT 1833 

1867 GCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGC 1926 

I I I I III II II III I I I I I I I I I I I I I I III 

1834 GC GT GT CAT GT GCT CCT GGACAGCTTT GGGACCT AT GCGCT CACT GGAGAGCCAAT CACA 1893 

1927 GTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTC 1986 

I I I I I I II I I I I I I I I I I I II I II I I I I I I I I I I I 

1894 GACTGTGCCGTGAAGCAACTGAAGGTGGCGGTTTTTGGCTGCATGTCCTGTAACTCCCTG 1953 

1987 GAGT ACAACAT CCGGGTCTACT GC CTGC AT GACACCCACGAT GCACTCAAGGAGGTGGT G 2046 

I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I 

1954 GATT ACAACTT GAGAGTT T ACT GT GT GGACAAT ACC C CTTGT GCAT TT CAGGAAGT GGTT 2013 

2047 CAGCT GGAGAAGCAGCT GGGGGGAC AGCT GAT CC AGGAGC CAC GGGT CCT GCACT T CAAG 2106 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

2014 TCAGATGAAAGGCATCAAGGT GGACAGCTCCT GGAAGAACCAAAATTGCTGCATTTCAAA 2073 

2107 GACAGT T AC CACAAC CT GCGC CT AT CCAT CCAC GAT GT GCCCAGCT CCCT GTGGAAGAGT 2166 

I II I I III III II I I I I I I I I I I I I I I I I II 
2074 GGGAATACCTTTAGTCTTCAGATTTCTGTCCTTGATATTCCCCCATTCCTCTGGAGAATT 2133 

2167 AAGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGG 2226 

III I II I I I I I I I I I I I I I I I I I I I II I I I I 
2134 AAAC CATTCACTGC CT GC CAGGAAGTC C CGT T CT C C CGC GT GT GGT GCAGTAACC GGCAG 2193 

2227 TACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGC 2286 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I III I I II I I I I I 

2194 CCCCTGCACTGTGCCTTCTCCCTGGAGCGTTATACGCCCACTACCACCCAGCTGTCCTGC 2253 

2287 AAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACATC 234 6 

II III I I I I I I I I I I I I I I I I I I I I I I III 
2254 AAAATCT GCAT T CGGCAGCT CAAAGGCC AT GAAC AGAT C CT C CAAGT GC AGACAT CAAT C 2313 

2347 ACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCC 2406 

II II I I I II I I I I I I 

2314 CT AGAGAGTGAACGAGAAAC CAT CACTTT CTT CGC ACAAGAGGAC AGC ACTTT CC CT GCA 2373 



Qy 2407 CTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGC 2466 

I I I I I I I I I I I I I I I I I I I I I I I I III I I I I III III 
Db 2374 CAGACT GGCCC CAAAGCCTT CAAAATT CCCT ACT CCATCAGACAGCGGAT TT GT GCT ACA 2433 

Qy 2467 CTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTG 2526 

III I I I I I II I I I I I I I I I I I I I I I I I I I II 

Db 2434 TTT GAT AC C CCCAAT GCCAAAGGCAAGGACT GGCAGAT GTT AGCACAGAAAAACAGCAT C 2493 

Qy 2527 GAC AGC CAT CT CAGCTT CTTT GC CT C CAAGC CCAGCC CCACAGCCAT GAT C CT CAACCT G 2586 

I II I III I I I I I I I I I I I I III III I I I I I I I 

Db 2494 AACAGGAATT T AT CTT ATTT CGCT AC ACAAAGTAGC CCATCT GCT GTCATTTT GAAC CTG 2553 

Qy 2587 TGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGA 2646 

I I I I I I I I I I I I III III I I I I I I II II I 

Db 2554 T GGGAAGCT C GT CAT CAGC AT GAT GGT GAT CTT GACT CC CTGGCCT GT GC C CT T GAAGAG 2613 

Qy 2647 CT GGGC CAGCC AGAC GCT GGC CT CTT CACAGTGT CGGAGGCT GAG 2691 

III I I I I I I I I I I I I II I I I II 

Db 2614 ATT GGGAGGACACACACGAAACT CTCAAACATTT CAGAAT CC CAG 2658 
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Qy 127 CTT CC CCACTT C CT GGT GGAGC CC GAGGAT GTGT ACAT C GT CAAGAACAAGC C AGT GCT G 186 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 157 CTGCCTCATTT CATAGAGGAGCCAGAT GAT GCTTATATTATCAAGAGCAACCCTATTGCA 216 

Qy 187 CTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTG 246 

II I I I I I I M III I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 217 CT C AGGT GCAAAGC GAGGC C AGCCAT GC AGATAT T CT TCAAAT GCAAC GGC GAGT GGGT C 276 



Qy 247 CGC C AGGT GGAC C AC GT GAT C GAGC GCAGCACAGAC GGGAGC AGT GGGCT GCCCAC CAT G 306 

I Ml I I I I I I I II I I I I I I I I I I I II I 



Db 



277 CAT C AGAACGAGCACGT CT CT GAAGAGACT CT GGAC GAGAGCT C AGGTTT GAAGGT CCGC 336 



Qy 307 GAGGT C C GCATTAAT GTCT CAAGGCAGCAGGT C GAGAAGGT GT TCGGGCTGGAGGAATAC 366 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II II I II 

Db 337 GAAGT GTT CAT CAAT GTT ACT AGGCAACAGGT GGAGGACTTCCAT GGGC CCGAGGACT AT 396 

Qy 367 T GGT GCCAGT GCGT GGCAT GGAGCT C CT CGGGCAC CACCAAGAGT C AGAAGGCCTACAT C 426 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 397 TGGTGCCAGTGTGTGGCGTGGAGCCACCTGGGTACCTCCAAGAGCAGGAAGGCCTCTGTG 456 

Qy 427 CGCATAGCCAGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTG 486 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II III 

Db 457 C GC AT AGCCT ATTT AC GGAAAAACTTT GAACAAGACCC ACAAGGAAGGGAAGTT CCCATT 516 

Qy 487 GAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAG 546 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 517 GAAGGC AT GATT GTACT GCACT GCCGCC CAC CAGAGGGAGT CCCT GCT GCCGAGGT GGAA 576 

Qy 547 T GGCT C C GGAAC GAGGACCT GGT GGACC C GT C C CTGGAC CC CAAT GT ATACATCACGCGG 606 

I I I I I I I II I I I I I I I I I III II I II I I I I 

Db 577 T GGCT GAAAAAT GAAGAGC CCATT GACT CTGAACAAGAC GAGAACATT GAC ACCAGGGCT 636 

Qy 607 GAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTG 666 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 637 GACCATAACCT GAT CAT C AGGCAGGC AC GGCT CT CGGACT C AGGAAAT T ACACCT GCAT G 696 

Qy 667 GCCAAGAACAT C GT GGCAC GT CGCC GCAGCGC CT CCGCT GCT GTCAT CGT CT ACGT GAAC 726 

II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 697 GCAGCCAACAT CGT GGCTAAGAGGAGAAGCCT GT CGGC CACT GTT GT GGT CT ACGT GGAT 756 

Qy 727 GGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGG 786 

II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 757 GGGAGCT GGGAAGT GT GGAGCGAAT GGT C CGT CT GCAGT C C AGAGT GT G AA 807 

Qy 787 CAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAG 846 

II I I I I I I I I I I I I I II III I I I I I I I I I I I I II I I 

Db 808 C ATTT GC GGAT C CGGGAGT GCACAGCACCACCCCC GAGAAAT GGGGGCAAATTCT GT GAA 867 

Qy 847 GGGC AGAAT GT C CAGAAAACAGC CT GC GCCAC CCTGT G CCC AGTAGAC GGCAGCT GGAGC 906 

III I I I I I I II III III I II 

Db 868 GGTC — TAAGCCAGGAAT CT GAAAACT GCACAGAT GGT CTTT GCAT CCT AGATAAAAAAC 925 

Qy 907 CCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGC 966 

I I I I I I I I I I I I II I I I I I 

Db 926 CT CTTC ATGAAAT AAAAC C CCAAAGCATT GAG AATGCCAGCGACATTGCTTTGTAC 981 

Qy 967 T CT GAC C CAGCACCCCGCAAC GGAGGGGAGGAGT GC C AGGGC ACT GAC CT GGACACCC GC 1026 

I I I I I I I I I I I I I I I I I I I I I II 

Db 982 TCGGGCTTGGGTGCTGCCGTCGTGGCCGTTGCAGTCCTGGTCATTGGTGT CACC 1035 

Qy 1027 AACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTAT 1086 

II I II III III I I I II III 

Db 1036 CT T TACAGACGGAGCC AGAGT GACT AT GGC GT GGACGT CAT T GACT CT T CT GCAT T GACA 1095 

Qy 1087 GTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTT 1146 

I I I I I I I I I I II I I I I I Mil 111 I 

Db 1096 GGTGGCTTCCAGACCTTCAACTTCAAAACAGTCCGTCAAGGTAACTCCCTGCTCCTGAAT 1155 
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1147 TAT T GCC GGAAGAAGGAGGGGCT GGACT CAGAT GT GGCTGACT C GT CCATT CT CAC CT CA 1206 

I I I I I I I I I I I I Ml I I I I I 

1156 TCTGCCATGCA GCC AGATCT GACAGT GAGCC GGAC AT ACAGCGGACCCAT CT 1207 

1207 GGCTT CCAGC CC GT CAGCAT CAAGC C C AGCAAAGC AGACAACCC C CAT CT GCT CAC CAT C 1266 

MM I I II I II II II I I III I I I I Mill 

1208 GTCTGCAGGACCCTCTGGACAAGG AGCT CAT GACAGAGT CCT CACT CTTTAAC CCTT 1264 

1267 CAGC C GGACCT CAGCAC C ACCACCACCACCT AC CAGGGCAGTCT CT GT CCCCGGCAGGAT 1326 

II I I I I I I I I I I I I III 

1265 T GT C GGACAT CAAAGTGAAAGT CCAGAGCT CGTT C AT GGTTTC CCTGGGAGTGT CT GAGA 1324 

1327 GGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGC 1386 

II I I I I I I I III III I 

1325 GAGCT GAGT ACCAC GGCAAGAAT CATT CCAGGACT T TT 1362 

1387 CGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTC 1446 

I I I I I I I I I I I I I II II III I I I I I I I 
1363 CC C C AT GGAAACAAC CACAGCTTT AGT ACAAT GC AT C CCAGAAAT AAAAT GCC CT ACAT C 1422 

1447 T C CAC CCAGAACT ACT T CCGCT CC CTGC CC CGAGGC ACCAGCAACAT GAC CT AT GGGAC C 1506 

III I I I I I I I I I I I II I I III I 
1423 CAAAATCTG TC AT CACT C C CCACAAGGACAGAACT GAGGACAACT GGT GT C 1473 

1507 TTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCC 1566 

II I I I I I I II I I I I II I I I I I I I I I I I I I II I I I I I I 

1474 TTTGGCCATTTAGGGGGGCGCTTAGTAATGCCAAATACAGGGGTGAGCTTACTCATACCA 1533 

1567 C CAGAT GCCAT AC CC CGAGGGAAGAT CT AT GAGAT CT ACCT CAC GCT GCACAAGCC GGAA 1626 

I II I I I I II I I I I I I I I I I I I I I I I I I I I I 

1534 CAC GGT GC CAT CC CAGAGGAGAATT CTT GGGAGATTT ATAT GT C CAT CAACCAAGGT 1590 

1627 GAC GT GAGGTT GCC C CT AGCT GGCT GT CAGACC CT GCT GAGTC C CAT C GT T AGCT GT GGA 1686 

II II II I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

1591 GAAC C CAGC CT C CAGT CAGAT GGCT CT GAGGT GCT CCT GAGTC CT GAAGT C AC CT GT GGT 1650 

1687 CCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCC 1746 

I I I I II I I I I I I I II I I I I I I I I I I I I I II I 
1651 CCT CCAGACATGATCGTCACCACT CCCTTT GCATT GACCATCCCGCACTGT GCAGAT GTC 1710 

1747 AGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGAT 1806 

II I I I I III I II I I II I I II I I I I I I I I I I I I I I 

1711 AGTT CT GAGCATT GGAAT AT C CAT TT AAAGAAGAGGACAC AGCAGGGCAAAT GGGAGGAA 1770 

1807 GTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGT 1866 

I I II I III I I I I I III II I I I I I I I I I I I II I 
1771 GT GAT GT CAGT GGAAGAT GAAT CT ACAT C CTGTTACTGCCTTTTGGACCCCTTT 1824 

1867 GCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGC 1926 

II I I III II II III I I I I I I I I I I I I I I III 

1825 GCGTGTCATGTGCTCCTGGACAGCTTTGGGACCTATGCGCTCACTGGAGAGCCAATCACA 1884 

1927 GTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTC 1986 

I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

1885 GACTGTGCCGTGAAGCAACTGAAGGTGGCGGTTTTTGGCTGCATGTCCTGTAACTCCCTG 1944 



Qy 1987 GAGTACAACAT CC GGGT CTACTGCCTGCAT GACAC C CACGAT GCACT CAAGGAGGT GGT G 204 6 

I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I 

Db 1945 GATT ACAACTT GAGAGTT T ACT GT GTGGACAATACCCCTTGT GC ATTT C AGGAAGT GGTT 2004 

Qy 2047 CAGCTGGAGAAGCAGCT GGGGGGAC AGCT GAT CCAGGAGCCAC GGGTC CT GCACTT CAAG 2106 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 2005 TC AGAT GAAAGGC AT CAAGGT GGAC AGCTC CT GGAAGAACCAAAATTGCT GC ATTT CAAA 2064 

Qy 2107 GACAGTT ACCACAAC CT GCGC CT AT CCATC CACGAT GT GCCCAGCT CCCT GT GGAAGAGT 2166 

I I I I I III III III I I I 1 I I I I I I I II I I II 

Db 2065 GGGAAT ACCT TTAGT CTT CAGATTT CT GT C CT T GAT ATT CCCC CAT TC CT CT GGAGAATT 2124 

Qy 2167 AAGCTCCTT GT CAGCT AC CAGGAGATC C CCTTTTAT CACATCT GGAAT GGCACGC AGC GG 2226 

III I I I I I I I I I I I II II I I I I I I I II I I I I 

Db 2125 AAAC CAT TCACTGCCT GC CAGGAAGTC C C GT T CT CCC GCGT GT GGT GC AGT AACC GGCAG 2184 

Qy 2227 TACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGC 2286 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I III I I I I I I I I I 
Db 2185 CCCCTGCACTGTGCCTTCTCCCTGGAGCGTTATACGCCCACTACCACCCAGCTGTCCTGC 2244 

Qy 2287 AAGCTGTGGGTGT GGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTT CAACATC 2346 

II III I I I I I I I I I I I I I I I I I I I I I I III 

Db 2245 AAAATCT GCATTC GGC AGCT CAAAGGC CAT GAACAGAT CCT C CAAGT GCAGACAT CAAT C 2304 

Qy 2347 ACCAAGGACACAAGGTTT GCT GAGCTGCT GGCTCT GGAGAGTGAAGCGGGGGTCCCAGCC 24 06 

II II I I I II I I I I I I 

Db 2305 CT AGAGAGT GAAC GAGAAAC CAT CACT TT CTT CGCACAAGAGGACAGCACTTT CCCT GCA 2364 

Qy 2407 CTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGC 24 66 

II I I I I I I I I I I I I I I I I I I I I I I III I I I I III III 
Db 2365 CAGACT GGC C CCAAAGC CTT CAAAATT CCCT ACT C CAT C AGAC AGCGGATTT GTGCT ACA 2424 

Qy 2467 CTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTG 2526 

III I I I I I II I I I I I I I II I I I I I I I I I I II 

Db 2425 TTT GAT AC C CC CAAT GCCAAAGGCAAGGACT GGC AGAT GTT AGC ACAGAAAAACAGCAT C 24 84 

Qy 2527 GACAGCCAT CT CAGCTT CTTT GC CT CCAAGCCCAGC CCCAC AGCC AT GAT CCTCAACCT G 2586 

I I I I III I I I I I I I I I I I I III III I I I I I I I 

Db 2485 AACAGGAATTT AT CTT ATTT C GCT ACACAAAGTAGC CCATCT GCT GT C ATTTT GAACCT G 2544 

Qy 2587 TGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGA 264 6 

I I I I I I I I I I I I III III I I I I I I II II I 

Db 2545 TGGGAAGCT CGT CAT CAGC AT GAT GGT GAT CT TGACT C C CT GGCCT GT GC CCTTGAAGAG 2604 

Qy 2647 CTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAG 2691 

I II I II II I II I I I I I I I I I I I 

Db 2605 ATT GGGAGGAC ACACAC GAAACT CT CAAACAT TT CAGAATC CCAG 2649 
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Qy 127 CTT C CC CACTT CCT GGT GGAGCCCGAGGATGT GT ACAT C GT CAAGAACAAGCCAGT GCT G 186 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 157 CT GC CT CATT T C AT AGAGGAGCC AGAT GAT GCTT AT ATT AT CAAGAGCAACC CT ATT GCA 216 

Qy 187 CTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTG 246 

II I I I I I I II III I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 217 CT CAGGT GCAAAGC GAGGC CAGCCATGCAGAT AT T CTT CAAAT GCAAC GGC GAGT GG GT C 276 

Qy 247 CGC CAGGTGGAC C ACGT GAT C GAGC GCAGC AC AGAC GGGAGCAGT GGGCT GC C CACCAT G 306 

I III I I I I I I I II I I I I I I I I I II II I 

Db 277 CAT CAGAACGAGCACGT CTCT GAAGAGACT CTGGACGAGAGCTCAGGTTTGAAGGTCCGC 336 

Qy 307 GAGGT C CGC AT TAAT GT CTCAAGGCAGCAGGT CGAGAAGGT GTT C GGGCT GGAGGAAT AC 366 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 337 GAAGTGTTCAT CAATGTT ACTAGGCAACAGGT GGAGGACTTCCAT GGGCCCGAGGACTAT 396 

Qy 367 TGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCCTACATC 426 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 397 TGGTGCCAGTGTGTGGCGTGGAGCCACCTGGGTACCTCCAAGAGCAGGAAGGCCTCTGTG 456 

Qy 427 CGC ATAGCC AGATT GCGCAAGAACTTC GAGCAGGAGC C GCT GGCCAAGGAGGT GT CC CT G 4 86 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I III 

Db 457 CGCATAGCCTATTTACGGAAAAACTTTGAACAAGACCCACAAGGAAGGGAAGTTCCCATT 516 

Qy 487 GAGCAGGGCAT CGT GCT GCCCTGCC GT C CAC CGGAGGGC AT C CCT C CAGCCGAGGT GGAG 546 

II II II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 517 GAAGGC ATGAT TGT ACT GCACT GCC GCC CACCAGAGGGAGT C CCT GCT GCC GAGGT GGAA 57 6 

Qy 547 TGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATCACGCGG 606 

I I I I I I I I I I I I I I I I I I III II I I I I I I I 

Db 577 TGGCT GAAAAAT GAAGAGC CCATT GACT CT GAACAAGAC GAGAACATT GACAC C AGGGCT 636 

Qy 607 GAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTG 666 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 637 GAC C ATAAC CT GAT CAT CAGGCAGGCACGGCT CT CGGACTCAGGAAAT T ACACCT GC AT G 696 

Qy 667 GCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAAC 726 

II I I I I I I I I I II I I I I I I I I I I I I I I II I I I I II I I 
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697 GCAGCCAAC AT CGT GGCTAAGAGGAGAAGCCT GT CGGCCACT GTTGTGGT CT ACGT GGAT 756 

727 GGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGG 786 

II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
757 GGGAGCT GGGAAGT GT GGAGC GAAT GGT CC GT CT GC AGT CCAGAGT GT G AA 807 

787 CAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAG 846 

II I I II I I I I I I I I I II III I I I I I I I I I I I I I I I I 

808 C ATTT GC GGAT C C GGGAGT GCACAGCAC CACCCCCGAGAAAT GGGGGCAAATT CT GT GAA 867 

847 GGGCAGAAT GT C C AGAAAAC AGC CT GCGCCACCCT GT GCCCAGT AGACGGC AGCT GGAGC 906 

I I I I I I I I I I I I I I I I II 

868 GGT CTAAGC CAGGAAT CT GAAAACT GCACAGAT GGT CTTTGCATCCTAGGCATTGAGAAT 927 

907 CCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGC 966 

II II I I I I I I I I I 
928 GCCAGCGACATTGCTTTGTACTCGGGCTTGG 958 

967 T CT GACC CAGCAC CCC GCAAC GGAGGGGAGGAGT GCCAGGGCACT GACCTGGACACCCGC 1026 

I I I I I I I I I I I I II 

959 GTGCTGCCGTCGTGGCCGTTGCAGTCCTGGTCATTGGTGTCACC 1002 

1027 AACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTAT 1086 

II I II III III Mill III 

1003 CTT T ACAGACGGAGC C AGAGT GACT AT GGCGT GGAC GT C ATT GACT CTT CT GC ATT GACA 1062 

1087 GTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTT 1146 

I I I I I I II I III I I II I I I I I I I I I 

1063 GGTGGCTTCCAGACCTTCAACTTCAAAACAGTCCGTCAAGGTAACTCCCTGCTCCTGAAT 1122 

1147 TATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCTCA 1206 

I I I I I I I I I I I I III I I I I I 

1123 TCTGCCATGCA GC C AGAT CT GACAGT GAGC CGGACAT ACAGC GGACC CAT CT 1174 



1207 GGCTTC C AGCCCGT CAGCAT CAAGC CCAGCAAAGCAGACAACC CC CAT CT GCT C AC CAT C 

I I I I I I I I I I I II III I III I I I I I I I I I 

1175 GT CT GCAGGACCCT CT GGACAAGG AGCT CAT GACAGAGTCCTCACTCTTTAACC CTT 



1267 



1232 



1327 



C AGC CGGACCT CAGCAC CACC AC CACCACCT ACCAGGGCAGT CT CT GT C C C CGGCAGGAT 

I I I I I I I I I I I I I I III 

T GT CGGACAT CAAAGT GAAAGT C C AGAGCT CGTT CAT GGTTT CC CT GGGAGT GTCTGAGA 



GGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGC 
I I I II II I I III III I 
1292 GAGCTGAGT AC CACGGCAAGAAT CATT CC AGGACTTTT 



1266 



1231 



1326 



1291 



1386 



1329 



1387 CGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTC 1446 

I III I I I I I I I I I I I II I I I I I II I II 
1330 CCCCAT GGAAACAACCACAGCTTTAGTACAATGCAT CCCAGAAATAAAAT GCCCTACAT C 1389 

1447 T C CACC CAGAACT ACT T CCGCTCCCTGCCCC GAGGCAC C AGCAACATGAC CT ATGGGAC C 1506 

III I I I I I I I I I I I I I I I I II I 

1390 CAAAATCTGT CAT CACTCC CCACAAGGACAGAACTGAGGACAACTGGTGTC 1440 

1507 TTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCC 1566 

II I III III II I I It I I I II I I II I I III I I I I II II 

1441 TTTGGCCATTTAGGGGGGCGCTTAGTAATGCCAAATACAGGGGTGAGCTTACTCATACCA 1500 



1567 CCAGATGC CAT ACC CCGAGGGAAGAT CT AT GAGATCT ACCTCACGCT GCACAAGC C GGAA . 1626 

I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I 
1501 CAC GGT GC CAT C CCAGAGGAGAATT CT T GGGAGATTT AT AT GT CCAT CAACCAAGGT 1557 

1627 GACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGA 1686 

I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1558 GAACCCAGCCT CCAGT C AGAT GGCT CT GAGGTGCTC CTGAGT CCT GAAGT CAC CT GT GGT 1617 

1687 CCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCC 1746 

I I I I I I I I I I I I I II I I I I I I I I I I I I I II I 
1618 CCT CCAGAC AT GAT C GTC ACCACT C C CTTT GCATTGACCATCC CGCACT GT GCAGAT GT C 1677 

1747 AGCCCT GACAGCTGGAGC CT GCGC CT CAAAAAGCAGT CGT GC GAGGGCAGCT GGGAGGAT 1806 

II I I II I I I I II I I I I I I II I I I I I I I I I I I I I I 

1678 AGTTCT GAGCATT GGAAT AT C CATT T AAAGAAGAGGACACAGCAGGGCAAAT GGGAGGAA 1737 

1807 GTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGT 1866 

I II I I II I I I I I I III II I I I I I I I I I I I II I 

1738 GT GAT GT CAGT GGAAGAT GAAT CT ACAT C CTGTTACTGCCTTTTGGACCCCTTT 1791 

1867 GCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGC 1926 

I I I I III II II III I I I I I I I I I I I I I I III 

1792 GCGTGTCATGTGCTCCTGGACAGCTTTGGGACCTATGCGCTCACTGGAGAGCCAATCACA 1851 

1927 GTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTC 1986 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1852 GACTGT GCCGT GAAGCAACT GAAGGT GGCGGTT T TT GGCT GCAT GT CCT GT AACT CC CT G 1911 

1987 GAGTAC AACAT C CGGGT CT ACT GCCT GCAT GACACC CACGAT GCACT CAAGGAGGT GGT G 2046 

I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I 

1912 GAT TACAACTT GAGAGTTT ACT GT GT GGACAAT ACC C CTT GT GC AT TT CAGGAAGT GGTT 1971 

2047 CAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAG 2106 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1972 T CAGAT GAAAGGC AT CAAGGT GGACAGCTC CTGGAAGAACCAAAATTGCT GC ATTT CAAA 2031 

2107 GACAGTT ACCACAAC CT GC GC CT AT C CATC CACGAT GT GC CC AGCT CC CT GT GGAAGAGT 2166 

I II I I III III II I I I I I I I I I I I I I I I I II 
2032 GGGAATACCTTTAGTCTTCAGATTTCTGTCCTTGATATTCCCCCATTCCTCTGGAGAATT 2091 

2167 AAGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGG 2226 

Ml I I I I I I I I I I I I I I I I I I I I I I II I I I I 

2092 AAACCATTCACTGCCTGCCAGGAAGTCCCGTTCTCCCGCGTGTGGTGCAGTAACCGGCAG 2151 

2227 TACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGC 228 6 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I III I I I I I I I I I 
2152 CCCCTGCACTGTGCCTTCTCCCTGGAGCGTTATACGCCCACTACCACCCAGCTGTCCTGC 2211 

2287 AAGCT GTGGGT GTGGCAGGT GGAGGGC GAC G GGC AGAGCTTCAGCAT CAACTT CAACAT C 2346 

II III I I I I I I I I I I I I I I I I I I I I I I III 
2212 AAAAT CTGC AT T CGGC AGCT CAAAGGC CAT GAAC AGATCCT CCAAGT GC AGACAT CAAT C 2271 

2347 ACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCC 2406 

II II I I I II I I I I I I 

2272 CT AGAGAGT GAAC GAGAAAC CAT C ACT T T CT TC GCACAAGAGGACAGC ACT TT C C CT GCA 2331 



Qy 2407 CTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGC 2466 

II- I I I I I I I I I I I I I I I I I I I I I I III I I I I II I III 
Db 2332 C AGACTGGCC C CAAAGCCTT CAAAATT CCCT ACT C CAT CAGACAGCGGATTTGT GCT ACA 2391 

Qy 2467 CTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTG 2526 

III I I I I I II I I I I II I I I I I I I I I I I I I II 

Db 2392 TTT GATAC CC CCAAT GC CAAAGGCAAGGACT GGCAGAT GTT AGCACAGAAAAAC AGCAT C 2451 

Qy 2527 GAC AGC C ATCT C AGCTT CTT T GC CT CCAAGC CCAGC CCCACAGCCAT GAT CCT CAACCT G 2586 

I I I I III I I I I I I I I I I I I III III I I I I I I I 

Db 2452 AACAGGAATT TAT CTT ATTT CGCT ACACAAAGT AGCCCAT CTGCT GT CATTTTGAACCT G 2511 

Qy 2587 TGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGA 2646 

I I I I I I I I I I I I III III I I I I I I II II I 

Db 2512 T GGGAAGCTC GT CAT CAGCAT GATGGT GAT CTT GACT CC CT GGCCTGT GC C CTT GAAGAG 2571 

Qy 2647 CTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAG 2691 

III I II II I I I I I I I I I I I I II' 

Db 2572 AT T GGGAGGACACAC ACGAAACT CT CAAACATTT CAGAAT CCC AG 2616 



RESULT 13 
US-09-471-276-345 

; Sequence 345, Application US/09471276 
; Patent No. 6822072 
; GENERAL INFORMATION : 

; APPLICANT: Dumas Milne Edwards, J.B. 

; APPLICANT: Duclert A. 

; APPLICANT: Giordano, J.Y. 

; TITLE OF INVENTION: Expressed Sequence Tags and Encoded Human Proteins. 

; Patent No. 6822072 

; FILE REFERENCE: GENSET . 025CP1 

; CURRENT APPLICATION NUMBER: US/09/471,276 

; CURRENT FILING DATE: 1999-12-21 

; EARLIER APPLICATION NUMBER: 09/057,719 

; EARLIER FILING DATE: 1998-04-09 

; EARLIER APPLICATION NUMBER: 09/069,047 

; EARLIER FILING DATE: 1998-04-28 

; EARLIER APPLICATION NUMBER: PCT/IB99/00712 

; EARLIER FILING DATE: 1999-04-09 

; NUMBER OF SEQ ID NOS : 1622 

SOFTWARE: Patent. pm 
; SEQ ID NO 345 
; LENGTH: 349 

TYPE: DNA 
; ORGANISM: Homo sapiens 

FEATURE : 

NAME/ KEY: CDS 

LOCATION: 207.. 347 

NAME/KEY: sig_peptide 

LOCATION: 207.. 278 

OTHER INFORMATION: Von Heijne matrix 
OTHER INFORMATION: score 5.40000009536743 
OTHER INFORMATION: seq SCCCLSSSSFIAG/RR 
US-09-471-276-345 



Query Match 



12.0%; Score 323; DB 4; Length 349; 



Best Local Similarity 98.8%; Pred. No. 4.4e-64; 

Matches 335; Conservative 1; Mismatches 2; Indels 1; Gaps 



1; 



Qy 889 GT AGAC GGCAGCT GGAGC CCGTGGAGCAAGT GGT CGGCCTGT GGGCT GGACT GCAC C CAC 948 

II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 12 GTGGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCAC 71 

Qy 949 TGGCGGAGCCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGC 1008 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I t I I II I II I I II I I I I I I II I II I I I I I I 
Db 72 TGGCGGA-CCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGC 130 

Qy 1009 ACT GACCT GGACAC CCGCAACT GT ACCAGT GACCT CT GT GTAC AC AGTGCT T CTGGC C CT 1068 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 131 ACTGACCTGGACACCCGCAACTGTACCAGTGACCTCTGTGTACACACTGCTTCTGGCCCT 190 

Qy 1069 GAGGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTG 1128 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I : I I I I I I I I I I I I I I 
Db 191 GAGGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCBTGGTCCTGCTGCTG 250 

Qy 1129 CTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGAC 1188 

I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 251 CTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGAC 310 

Qy 1189 TCGTCCATTCTCACCTCAGGCTTCCAGCCCGTCAGCATC 1227 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 311 TC GT C C ATT CT CAC CT CAGGCT T C CAGCCCGT CAGCAT C 349 



RESULT 14 
US-09-969-532-31 

; Sequence 31, Application US/09969532 

; Patent No. 6777232 

; GENERAL INFORMATION: 

; APPLICANT: Walke, D. Wade 

; APPLICANT: Scoville, John 

; TITLE OF INVENTION: No. 6777232el Human Membrane Proteins and Polynucleotides 

Encoding the Same 

; FILE REFERENCE: LEX-0244-USA 

; CURRENT APPLICATION NUMBER: US/09/969, 532 

; CURRENT FILING DATE: 2001-10-02 

; PRIOR APPLICATION NUMBER: US 60/237,280 

; PRIOR FILING DATE: 2000-10-02 

; NUMBER OF SEQ ID NOS : 33 

; SOFTWARE: Fast SEQ for Windows Version 4.0 
; SEQ ID NO 31 

LENGTH: 1968 . 

TYPE: DNA 
; ORGANISM: homo sapiens 
US-09-969-532-31 



Query Match 10.9%; Score 293.2; DB 4; Length 1968; 

Best Local Similarity 53.7%; Pred. No. 4.9e-57; 

Matches 657; Conservative 0; Mismatches 558; Indels 9; Gaps 2; 



Qy 1468 TCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGG 1527 

I I I I I I I I I II II II III III I I I I I I I II 

Db 709 T C ACTCC CCACAAGGACAGAACT GAGGACAACTGGT GT CTT T GGCC ATT T AGGGGGGC GC 768 



Qy. 1528 CT GATGAT CCCTAAT ACAGGT AT CAGCCT CCT CAT CCCCCCAGAT GCCAT AC C CCGAGGG 1587 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 769 TT AGTAAT GCCAAAT ACAGGGGTGAGCTT ACTCAT ACCACAC GGT GCCAT CC CAGAGGAG 828 

Qy 1588 AAGATCTATGAGAT CTACCTCACGCTGCACAAGCCGGAAGACGTGAGGTT GCCCCTAGCT 1647 

II I I I I I I I I I I I I I I III I I I I I III 
Db 829 AATTCTTGGGAGATTTATATGTCCATCAACCAAGGTGAACCC AGCCT CC AGT CAGAT 885 

Qy 1648 GGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACC 1707 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 886 GGCT CT GAGGT GCT C CT GAGT CCT GAAGT CACCT GT GGT CCT C CAGAC AT GAT CGT CAC C 945 

Qy 1708 CGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTG 1767 

II I I I I I I I I I I I I I II III I I I I I I II I 

Db 94 6 ACT C CCT TT GCATT GAC C ATC CC GC ACT GT GCAGAT GT CAGTT CT GAGC ATT GGAATAT C 1005 

Qy 17 68 CGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAG 1827 

I I I I I I I II I I I I I I I I I I I I I I I I I I I III I I I I 

Db 1006 CAT T TAAAGAAGAGGAC ACAGCAGGGCAAATGGGAGGAAGT GATGT CAGT GGAAGAT GAA 1065 

Qy 1828 GCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAG 1887 

I III II I I I I I I I I I I I II I I I I I III II II 

Db 1066 TCTACATC CTGTTACTGCCTTTTGGACCCCTTTGCGTGTCATGTGCTCCTGGAC 1119 

Qy 1888 CAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTC 1947 

III I I I I I I I I I I I I I I III I I I I I I I I I I II 

Db 1120 AGCT TT GGGACCT AT GC GCT CACT GGAGAGC CAAT C ACAGACT GT GCC GT GAAGCAACT G 1179 

Qy 1948 AAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTAC 2007 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1180 AAGGTGGCGGTTTTTGGCTGCATGTCCTGTAACTCCCTGGATTACAACTTGAGAGTTTAC 1239 

Qy 2008 T GC CTGC AT GACACCC ACGAT GC ACT CAAGGAGGT GGT GCAGCT GGAGAAGCAGCT GGGG 2067 

II III I I I I I I I I I I II I I I I I I I I I I I I I I II 

Db 1240 TGT GTGGACAAT ACC C CTT GT GC ATTT CAGGAAGT GGTT T CAGAT GAAAGGCATCAAGGT 1299 

Qy 2068 GGACAGCT GAT CCAGGAGCC ACGGGT CCT GCACTT CAAGGAC AGTT AC C ACAACCT GC GC 2127 

I I I I I I I I I I I I I I I I II I I I I I I I I I II I I III 

Db 1300 GGACAGCT CCT GGAAGAAC CAAAATTGCT GCATTT CAAAGGGAAT ACCTTT AGTCT T CAG 1359 

Qy 2128 CTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAGAGTAAGCTCCTTGTCAGCTACCAG 2187 

III III I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 1360 ATTTCTGTCCTTGATATTCCCCCATTCCTCTGGAGAATTAAACCATTCACTGCCTGCCAG 1419 

Qy 2188 GAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTACTTGCACTGCACCTTCACC 2247... 

II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 1420 GAAGTCCCGTTCTCCCGCGTGTGGTGCAGTAACCGGCAGCCCCTGCACTGTGCCTTCTCC 1479 

Qy 2248 CTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTG 2307 

I I I I I II I I I II I I III I I I I I I I I I I I III I I I I I I I 
Db 1480 CTGGAGCGTTATACGCCCACTACCACCCAGCTGTCCTGCAAAATCTGCATTCGGCAGCTC 1539 

Qy 2308 GAGGGC GAC GGGC AGAGCTT CAGCATCAACTT CAACAT CAC CAAGGACACAAGGT TT GCT 2367 

I I I I I I I I I I I I I II III II II I 

Db 1540 AAAGGCCAT GAACAGATCCT CCAAGTGCAGACATCAAT CCTAGAGAGTGAACGAGAAACC 1599 



Qy 2368 GAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTC 2427 

I I II I I I I I I I I I I I I I I I I I I I II 

Db 1600 AT CACTT TCTT CGCACAAGAGGACAGCACTTT C C CT GCACAGACT GGCCCCAAAGC CTT C 1659 

Qy 2428 AAGAT C CCCT T C CT CATT C GGCAGAAGATAATTT CCAGC CT GGAC C CACCCT GTAGGC GG 2487 

I I I I I I I I I III I I I I III III III I I I I I 

Db 1660 AAAATT C CCT ACT C CAT CAGACAGCGGATTT GTGCT ACATTT GAT ACCC CCAATGC CAAA 1719 

Qy 24 88 GGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCATCTCAGCTTCTTT 2547 

II I I I I I I I I I I I I I I I I I I I II I I I I III I II 

Db 1720 GGCAAGGACT GGCAGAT GTT AGC ACAGAAAAACAGCAT CAAC AGGAATT TATCTT ATTT C 1779 

Qy 2548 GCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCC 2607 

II I I I I I I I III III I I I I I I I I I I I I I I I I I I I 

Db 1780 GCTACACAAAGTAGCCCATCT GCT GTCATTTTGAACCTGTGGGAAGCTCGT CATCAGCAT 1839 

Qy 2608 AACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGC 2667 

III III I I I I I I II II I III I I I I I I 

Db 1840 GAT GGT GAT CTTGACT CC CT GGCCT GT GCC CT TGAAGAGAT T GGGAGGAC ACACAC GAAA 1899 

Qy 2668 CT CT T CACAGT GT C GGAGGCT GAG 2691 

I I I I I I I I I I I II 
Db 1900 CT CT CAAACATTT C AGAAT C CC AG 1923 



RESULT 15 
US-09-969-532-29 

; Sequence 29, Application US/09969532 

; Patent No. 6777232 

; GENERAL INFORMATION: 

; APPLICANT: Walke, D. Wade 

; APPLICANT: Scoville, John 

; TITLE OF INVENTION: No. 6777232el Human Membrane Proteins and Polynucleotides 

Encoding the Same 

; FILE REFERENCE: LEX-0244-USA 

; CURRENT APPLICATION NUMBER: US/09/969,532 

; CURRENT FILING DATE: 2001-10-02 

; PRIOR APPLICATION NUMBER: US 60/237,280 

; PRIOR FILING DATE: 2000-10-02 

; NUMBER OF SEQ ID NOS : 33 

SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 29 

LENGTH: 2001 
; TYPE: DNA 

; ORGANISM: homo sapiens 
US-09-969-532-29 

Query Match 10.9%; Score 293.2; DB 4; Length 2001; 

Best Local Similarity 53.7%; Pred. No. 4.9e-57; 

Matches 657; Conservative 0; Mismatches 558; Indels 9; Gaps 2; 

Qy 1468 TCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGG 1527 

I I I I I I I I I I I I III III III I I II I I I I I 

Db 742 TCACTCCCCACAAGGACAGAACTGAGGACAACTGGTGTCTTTGGCCATTTAGGGGGGCGC 801 

Qy 1528 CTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGATGCCATACCCCGAGGG 1587 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II 



802 TT AGTAAT GCCAAAT AC AGGGGT GAGCTTACT CAT ACCACAC GGTGCCATC CCAGAGGAG 861 



1588 AAGAT CT AT GAGATCT ACCT C AC GCTGCACAAGC CGGAAGACGT GAGGTTGCCCCT AGCT 1647 

II I I I I I I I I I I I I I I I I I I I I I I III 
862 AATT CTTGGGAGATTTAT AT GTC CAT CAACCAAGGT GAACCC AGC CT CC AGT CAGAT 918 

1648 GGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACC 1707 
I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

919 GGCT CT GAGGTGCT C CT GAGT CCT GAAGT CACCT GT GGT C CT CCAGACAT GAT CGT CACC 978 

1708 CGGC C AGT C ATCCT GGCT AT GGACCACT GTGGGGAGCC CAGCC CTGACAGCT GGAGC CT G 1767 
II I I I I I I I I I I I I I II III I I I I I I I I I 

979 ACT CC CTT T GCATT GAC CAT C C C GCACT GT GC AGAT GT CAGTT CTGAGCATT GGAAT AT C 1038 

1768 CGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAG 1827 

I I I I I I I II I I I I I I I I I I I II I I I I I I III I I I I 

1039 CATTTAAAGAAGAGGACACAGCAGGGCAAATGGGAGGAAGTGATGT CAGT GGAAGATGAA 1098 

1828 GCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAG 1887 

I III II I I I I I I I I I II II Mill III II II 

1099 TCTACATC CTGTTACTGCCTTTTGGACCCCTTTGCGTGTCATGTGCTCCTGGAC 1152 

1888 CAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTC 1947 

III I I I I I I I I I I I I I I III I I I I I I I I I I II 

1153 AGCTTT GGGACCT ATGC GCT CACT GGAGAGC CAAT C ACAGACT GTGCC GT GAAGCAACT G 1212 

1948 AAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTAC 2007 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1213 AAGGTGGCGGTTTTTGGCTGCATGTCCTGTAACTCCCTGGATTACAACTTGAGAGTTTAC 1272 

2008 T GCCT GC AT GAC ACCCAC GAT GC ACTCAAGGAGGT GGT GCAGCT GGAGAAGC AGCT GGGG 2067 

II II I I I I I I Mill M M I II I I II I I I I I II 

1273 T GT GT GGACAAT ACCC CT T GT GC ATTT C AGGAAGT GGT TT CAGAT GAAAGGC AT CAAGGT 1332 

2068 GGACAGCT GAT C C AGGAGC CACGGGTCCT GCACTT CAAGGAC AGTT ACCACAAC CT GCGC 2127 

I II I II II I I II I II I I I I M II I I I I II I I III 

1333 GGACAGCT CCT GGAAGAAC CAAAATTGCT GCATT T CAAAGGGAAT AC CTT T AGT CTT CAG 1392 

2128 CT AT C CAT CCAC GAT GT GCCCAGCT CCCT GT GGAAGAGTAAGCT CCT T GT CAGCT AC CAG 2187 

III II I II I I I M I II I I I II I I I I I I II I II I 

1393 ATTTCTGTCCTTGATATTCCCCCATTCCTCTGGAGAATTAAACCATTCACTGCCTGCCAG 1452 

2188 GAGAT CCC CT TT T AT CACAT CT GGAAT GGCAC GCAGC GGT ACT T GC ACTGCAC CTTCAC C 2247 

II II I I I I I I I I I II II I M I I I II I I I I II II I II 
1453 GAAGTCCCGTTCTCCCGCGTGTGGTGCAGTAACCGGCAGCCCCTGCACTGTGCCTTCTCC 1512 

2248 CTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTG 2307 

II II II I II I MM II I I I I I I II II II III I II II I I 
1513 CTGGAGCGTTATACGCCCACTACCACCCAGCTGTCCTGCAAAATCTGCATTCGGCAGCTC 1572 

2308 GAGGGCGACGGGCAGAGCTT CAGCATCAACTT CAACATCACCAAGGACACAAGGTTTGCT 2367 

I II I I I II I I I II II III M II I 

1573 AAAGGCCATGAACAGATCCT CCAAGTGCAGACATCAATCCTAGAGAGT GAACGAGAAACC 1632 

2368 GAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTC 2427 

I I II I I M I I I I II M I II II II II 

1633 ATCACTTTCTTCGCACAAGAGGACAGCACTTTCCCTGCACAGACTGGCCCCAAAGCCTTC 1692 



Qy 2428 AAGAT CC CCTT CCT C ATT CGGCAGAAGATAATTT C CAGCCT GGACC CACC CTGT AGGCGG 2487 

I I I I I I I I I III I I I I III III III I I I I I 

Db 1693 AAAATTCCCTACTCCATCAGACAGCGGATTTGTGCTACATTTGATACCCCCAATGCCAAA 1752 

Qy 2488 GGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCATCTCAGCTTCTTT 2547 

II I I I I II I I I I I I I I I I I I I II II I I III I II 

Db 1753 GGCAAGGACT GGCAGAT GTTAGC ACAGAAAAAC AGCAT CAACAG GAATTT AT CTT AT TT C 1812 

Qy 2548 GCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCC 2607 

II I I MIM Ml Ml I I I I I I I I I I I I I I I I I I I 

Db 1813 GCT AC ACAAAGT AGCCCATCT GCT GT CATTTT GAAC CT GT GGGAAGCT CGT CAT CAGCAT 1872 

Qy 2608 AACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGC 2667 

III III I I I I I I II II I III I I I I I I 

Db 1873 GATGGT GAT CTT GACTCCCT GGCCT GT GCCCTT GAAGAGAT TGGGAGGACACACAC GAAA 1932 

Qy 2668 CT CTT CAC AGT GTCGGAGGCT GAG 2691 

I I I I I I I I I I I II 
Db 1933 CTCTCAAACATTTCAGAATCCCAG 1956 



Search completed: March 6, 2005, 10:24:58 
Job time : 441.67 sees 



GenCore version .5 . 1 . 6 
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OM nucleic - nucleic search, using sw model 



Run on: March 6, 2005, 05:25:16 ; Search time 1458.63 Seconds 

(without alignments) 
10971.677 Million cell updates/sec 

US-10-624-932-l_COPY_4 6_2742 
Perfect score: 2697 

1 atggccgtccggcccggcct tgtcggaggctgagtgctga 2697 

IDENTTTYJtfUC 
Gapop 10.0 , Gapext 1.0 



Title 
Perfe 
Sequence : 

Scoring table 



Searched: 



5401638 seqs, 2966923429 residues 



Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 



10803276 



Post-processing: 



Minimum Match 0% 
Maximum Match 100% 
Listing first 45 summaries 



Database : 



Published__Applications_NA: * 

1: /cgn2_6/ptodata/2/pubpna/US07_PUBCOMB.seq:* 

2 : /cgn2_6/ptodata/2/pubpna/PCT_NEW_PUB. seq: * 

3 : /cgn2_6/ptodata/2/pubpna/US06_NEW_PUB. seq: * 

4 : /cgn2_6/ptodata/2/pubpna/US06_PUBCOMB.seq:* 

5 : /cgn2_6/ptodata/2/pubpna/US07__NEW_PUB . seq: * 

6: /cgn2_6/ptodata/2/pubpna/PCTUS_PUBCOMB.seq: * 

7: /cgn2_6/ptodata/2/pubpna/US08_NEW_PUB.seq:* 

8 : /cgn2_6/ptodata/2/pubpna/US08_PUBCOMB . seq: * 

9: /cgn2_6/ptodata/2/pubpna/US09A_PUBCOMB. seq: * 
10: /cgn2_6/ptodata/2/pubpna/US09B_PUBCOMB. seq: 
11: /cgn2_6/ptodata/2/pubpna/US09C_PUBCOMB.seq: 
12: /cgn2_6/ptodata/2/pubpna/US09_NEW_PUB.seq: * 
13: /cgn2_6/ptodata/2/pubpna/US10A_PUBCOMB.seq: 
14: /cgn2_6/ptodata/2/pubpna/US10B_PUBCOMB.seq: 
15: / cgn2_6/ptoda ta/ 2 /pubpna/US 1 0C_PUBCOMB . seq : 
16: / cgn2_6/ptodata/2 /pubpna/US 10D_PUBCOMB. seq: 
17: /cgn2_6/ptodata/2/pubpna/US10E_PUBCOMB. seq: 
18: /cgn2_6/ptodata/2/pubpna/US10F_PUBCOMB.seq: 
19: /cgn2_6/ptodata/2/pubpna/US10_NEW_PUB. seq: * 
20: /cgn2_6/ptodata/2/pubpna/USll_NEW_PUB. seq:* 
21: /cgn2_6/ptodata/2/pubpna/US60_NEW_PUB. seq: * 
22: /cgn2_6/ptodata/2/pubpna/US60_PUBCOMB. seq: * 

Pred. No. is the number of results predicted by chance to have a 

score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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Query Match 100.0%; Score 2697; DB 10; Length 2752; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2697; Conservative 0; Mismatches 0; Indels 0; Gaps 



Qy 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I 

Db 46 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 105 

Qy 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 106 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 165 

Qy 121 GACCT GCTT CC C C ACT T CCT GGT GGAGCCCGAGGAT GTGT ACAT CGT CAAGAACAAGCCA 180 

I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 166 GACCT GCT T CCCC ACTT C CT GGT GGAGC CCGAGGAT GTGT ACATCGT CAAGAACAAGCCA 225 

Qy 181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 226 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 285 

Qy 241 TGGGT GCGC CAGGT GGACCAC GT GATCGAGC GCAGC ACAGACGGGAGCAGT GGGCT GC C C 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 286 TGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCC 345 

Qy 301 AC CAT GGAGGT C CGC AT TAAT GT CT CAAGGCAGCAGGT C GAGAAGGT GTT CGGGCT GGAG 360 

I II I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 346 AC CAT GGAGGT C C GCAT TAAT GT CT CAAGGCAGCAGGT C GAGAAGGT GTT C GGGCT GGAG 405 

Qy 361 GAATACTGGTGC C AGT GCGT GGCAT GGAGCT CCT CGGGCACCAC CAAGAGT C AGAAGGC C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 06 GAATACT GGT GC C AGT GC GT GGCAT GGAGCT CCT CGGGCACCAC CAAGAGT CAGAAGGC C 465 

Qy 421 TACAT CCGC AT AGC C AGATT GC GCAAGAACT TCGAGCAGGAGC C GCT GGC CAAGGAGGT G 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 466 TACAT CCGC AT AGC C AGATT GC GCAAGAACT TCGAGCAGGAGCCGCT GGC CAAGGAGGT G 525 

Qy 481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 526 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 585 

Qy 541 GT GGAGTGGCT C CGGAACGAGGACCT GGT GGACC CGT CCCTGGAC C CCAAT GT AT ACAT C 600 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 586 GTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATC 645 

Qy 601 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 646 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 705 

Qy 661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 706 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 765 

Qy 721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 766 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 825 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 



781 



826 



841 



886 



901 



946 



961 



GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 
I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 

T GT GAGGGGCAGAATGT C C AGAAAACAGCCT GC GCCAC C CT GT GCCCAGT AGACGGCAGC 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

T GT GAGGGGCAGAATGT CC AGAAAACAGCCT GC GC CAC C CTGT GCCCAGT AGACGGCAGC 



840 



885 



900 



945 



960 



TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 1005 



GAGT GCTCT GAC CCAGC ACC CCGCAACGGAGGGGAGGAGT GCCAGGGC ACT GAC CT GGAC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1006 GAGT GCT CT GACC CAGC ACC CCGCAAC GGAGGGGAGGAGT GC CAGGGCACT GAC CT GGAC 1065 

1021 AC CC GCAACT GT ACCAGT GAC CT CT GT GTACAC AGT GCTT CT GGCC CT GAGGAC GTGGC C 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1066 AC C CGCAACT GT ACCAGT GAC CT CTGT GTACAC AGT GCTT CTGGCCCTGAGGACGT GGCC 1125 

1081 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1126 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1185 

1141 CT C GTT T AT T GC C GGAAGAAGGAGGGGCT GGACT CAGAT GTGGCTGACT C GT C CATT CT C 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1186 CT C GT T T ATT GC C GGAAGAAGGAGGGGCT GGACT CAGAT GTGGCTGACT C GT CCATT CT C 1245 

1201 ACCT CAGGCTT C CAGC CCGT CAGCATCAAGC C C AGCAAAGC AGACAAC CCCC AT CTGCT C 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
124 6 ACCT CAGGCTT C C AGC CC GT CAGCATCAAGC C C AGCAAAGCAGACAAC C CCC AT CT GCT C 1305 

1261 AC CAT C C AGC CGGACCT CAGCAC CAC CAC CAC C AC CT AC C AGGGCAGT CT CT GT C CC CGG 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
1306 ACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGG 1365 

1321 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1366 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1425 

1381 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I 
1426 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 14 85 

1441 CGC CT CT CC ACCCAGAACT ACTT C CGCT CCCT GCC CC GAGGCAC CAGCAACAT GACCT AT 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

14 86 C GCCT CT C C ACC C AGAACT ACTT C C GCT C CCT GCCCCGAGGC AC CAGCAACAT GACCT AT 1545 

1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1546 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1605 

1561 AT C C CCCC AGAT GC CAT AC C C CGAGGGAAGAT CT AT GAGAT CT ACCT CAC GCT GCACAAG 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1606 AT C CCC CC AGAT GC CAT ACC C CGAGGGAAGAT CT AT GAGAT CT ACCT CAC GCT GCACAAG 1665 

1621 C CGGAAGAC GTGAGGTT GCC C CT AGCT GGCT GT CAGACC CT GCT GAGT C C CAT C GTT AGC 1680 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1666 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1725 

Qy 1681 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1740 

I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1726 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1785 

Qy 1741 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1800 

I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1786 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1845 

Qy 1801 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 1846 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1905 

Qy 1861 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1906 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1965 

Qy 1921 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1966 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 2025 

Qy 1981 T CCCT CGAGT ACAAC AT CC GGGT CT ACT GCCT GC AT GACACC C ACGAT GCACT CAAGGAG 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2026 T CCCT CGAGT ACAACAT CCGGGT CT ACT GCCT GCAT GAG ACC CACGAT GCACT CAAGGAG 2085 

Qy 2041 GT GGT GCAGCT GGAGAAGCAGCT GGGGGGACAGCT GAT C C AGGAGC CACGGGT CCTGCAC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2086 GT GGT GCAGCT GGAGAAGCAGCT GGGGGGACAGCT GAT C C AGGAGCCACGGGT CCT GCAC 2145 

Qy 2101 TT CAAGGACAGT T AC C ACAACCT GCGC CT AT C CAT C C AC GAT GT GC C CAGCT CCCT GT GG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2146 T T CAAGGACAGTT AC C ACAACCT GCGC CT AT C CAT C C AC GAT GT GC C CAGCT C CCT GT GG 2205 

Qy 2161 AAGAGTAAGCTCCTTGT CAGCT AC CAGGAGAT C CCCT TTT AT CACAT CT GGAAT GGCACG 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2206 AAGAGTAAGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACG 2265 

Qy 2221 CAGC GGTACTTGCACT GC ACCTT CACC CT GGAGCGT GT CAGCC CCAGCACT AGT GAC CT G 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I 
Db 2266 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2325 

Qy 2281 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2340 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2326 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2385. 

Qy 2341 AAC AT CACCAAGGACACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GAAGCGGGGGT C 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2386 AACAT CACCAAGGACACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GAAGCGGGGGT C 2445 

Qy 2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2460 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2446 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2505 

Qy 2461 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2520 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 2506 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2565 

Qy 2521 CAC CT GGACAGCCAT CT CAGCTT CTTT GCCT CCAAGC CC AGCCCCACAGCCAT GAT C CT C 2580 

I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 2566 CACCT GGACAGCCAT CT CAGCTT CTTT GC CT C CAAGC CC AGCCCCACAGC CAT GATC CT C 2625 

Qy 2581 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2626 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2685 

Qy 2641 GCT GGACT GGGC CAGCCAGAC GCT GGC CT CT T C ACAGTGT CGGAGGCT GAGT GCT GA 2697 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2686 GCT GGACTGGGCCAGCCAGACGCT GGC CTCTTCACAGTGTCGGAGGCT GAGT GCTGA 2742 
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; GENERAL INFORMATION: 
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; PRIOR APPLICATION NUMBER: 60/225,146 

; PRIOR FILING DATE: 2000-08-14 

; PRIOR APPLICATION NUMBER: 60/225,392 

; PRIOR FILING DATE: 2000-08-15 

; PRIOR APPLICATION NUMBER: 60/225,470 

; PRIOR FILING DATE: 2000-08-15 
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; NUMBER OF SEQ ID NOS : 61 
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; SEQ ID NO 1 

LENGTH: 2752 
; TYPE: DNA 
; ORGANISM: Homo sapiens 
US-10-624-932-1 

Query Match 100.0%; Score 2697; DB 17; Length 2752; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2697; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 



Qy 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 46 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 105 

Qy 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGT GGC CAACCCAGTGCCTGGTGCCAACCCG 120 

I I I I I I I I I II I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 106 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 165 

Qy 121 GACCT GCT T C C CC ACT T C CT GGT GGAGC CCGAGGAT GT GT ACATC GTCAAGAACAAGCCA 180 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 166 GACCT GCT T C C CC ACT T C CT GGT GGAGC CCGAGGAT GT GT ACAT C GTCAAGAACAAGCCA 225 

Qy 181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 226 GT GCT GCTT GT GT GCAAGGCCGTGCCCGCCACGCAGATCTTCTT CAAGT GCAACGGGGAG 285 

Qy 241 T GGGT GC GC C AGGT GGAC CACGT GATCGAGCGCAGCACAGACGGGAGC AGTGGGCT GCCC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 286 T GGGTGC GC C AGGT GGAC CACGT GATCGAGCGCAGCACAGACGGGAGC AGTGGGCT GCCC 345 

Qy 301 ACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 346 AC CAT GGAGGT CC GC ATTAAT GT CT CAAGGC AGCAGGT CGAGAAGGT GTT CGGGCT GGAG 405 

Qy 361 GAAT ACT GGT GCC AGT GC GT GGC AT GGAGCT CCT C GGGCACCAC CAAGAGT C AGAAGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 406 GAAT ACT GGT GCCAGT GC GT GGC AT GGAGCT CCT CGGGCAC CAC CAAGAGT CAGAAGGCC 465 

Qy 421 T ACAT C C GCAT AGCC AGATT GC GCAAGAACTT CGAGCAGGAGCCGCT GGCCAAGGAGGT G 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 466 T ACAT CCGC AT AGCC AGATT GCGCAAGAACTT CGAGCAGGAGC C GCT GGCCAAGGAGGT G 525 

Qy 4 81 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 526 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 585 

Qy 541 GT GGAGT GGCT CC GGAACGAGGACCTGGT GGACC C GT C C CT GGAC CCCAATGT AT ACAT C 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



586 GTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATC 645 

601 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
646 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 705 

661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
706 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 765 

721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 780 

I I I I I II I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

766 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 825 

781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
826 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 885 

841 T GT GAGGGGCAGAAT GT C C AGAAAACAGCCT GCGCCAC CCT GT GCC C AGT AGAC GGC AGC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
886 T GT GAGGGGCAGAAT GT C C AGAAAACAGCCT GCGCCAC CCT GT GCC C AGT AGACGGCAGC 945 

901 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 960 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

946 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 1005 

961 GAGT GCT CT GACCC AGCACCC CGCAACGGAGGGGAGGAGT GC CAGGGCACT GACCT GGAC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1006 GAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGAC 1065 

1021 ACCCGCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCC 1080 

I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
1066 ACC CGCAACT GT AC CAGT GACCT CT GT GT AC ACAGTGCTT CT GGCC CT GAGGAC GT GGC C 1125 

1081 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 114 0 

I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
1126 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1185 

1141 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1186 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1245 

1201 ACCT CAGGCTT C CAGCCCGT CAGCATCAAGC C CAGCAAAGCAGACAAC CC C CAT CT GCTC 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1246 ACCT CAGGCTT C CAGCCCGT CAGCATCAAGC C CAGCAAAGCAGACAAC CCCC AT CT GCTC 1305 

1261 ACCAT CC AGCC GGAC CT CAGCAC C ACCACCAC CAC CT ACCAGGGCAGT CT CT GT C C C CGG 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1306 AC CAT CC AGC C GGAC CT CAGCAC CAC CAC CAC CAC CT ACCAGGGCAGT CT CTGT C C CCGG 1365 

1321 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1380 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I 
1366 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1425 

1381 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 1440 

II II I III I II I II I I I I I I I III III I I I I I II II II I II I II II I I I I I I II I II I II 
1426 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 1485 



Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 



14 41 CGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 1500 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
1486 CGCCT CT CCAC C CAGAACT ACTT CCGCT CCCT GCCCCGAGGCAC CAGCAAC ATGACCT AT 1545 

1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

1546 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1605 

1561 AT CCCCCCAGAT GC C AT ACC CCGAGGGAAGATCTATGAGAT CT AC CTCAC GCT GCACAAG 1620 

I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
1606 AT CCCC CC AGATGCCAT AC C C C GAGGGAAGAT CT AT GAGAT CT ACCTCACGCT GCACAAG 1665 

1621 CC GGAAGAC GT GAGGT T GCCC CT AGCT GGCT GTCAGAC C CT GCT GAGT CCCAT CGTT AGC 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1666 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1725 

1681 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
1726 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1785 

1741 GAGCC C AGC C CTGACAGCT GGAGC CTGC GC CT CAAAAAGCAGT CGT GC GAGGGCAGCTGG 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1786 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1845 

1801 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
1846 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1905 

1861 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1920 

I II I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II 
1906 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 



1965 



1921 



CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 198 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1966 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 2025 

1981 TC C CTCGAGTACAACAT C CGGGT CT ACT GC CT GC AT GACACCCAC GAT GCACT CAAGGAG 2040 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2026 TCC CT CGAGT ACAACAT C CGGGT CT ACT GCCT GCAT GAC AC C CAC GAT GCACT CAAGGAG 2085 

2041 GTGGTGCAGCT GGAGAAGCAGCT GGGGGGACAGCTGAT CCAGGAGCCACGGGT CCTGCAC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2086 GTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCAC 2145 

2101 T T CAAGGAC AGTT ACCACAACCT GCGC CTAT C CAT C CAC GAT GT GCCC AGCTC CCT GT GG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2146 TT CAAGGAC AGTT AC CACAAC CT GC GCCT AT C CAT C CAC GAT GT GC CC AGCT C CCT GT GG 2205 

2161 AAGAGTAAGCT CCTT GT CAGCT AC C AGGAGAT CCC CT T T TAT CACAT CT GGAAT GGCAC G 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2206 AAGAGTAAGCT C CTT GT CAGCT AC C AGGAGAT CCC CT T TT AT CACATCT GGAATGGCACG 2265 

2221 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2266 CAGCGGT ACTT GCACT GCACCTT CAC CCT GGAGCGTGTC AGC CCCAGC ACT AGTGACCTG 2325 



Qy 

Db 



2281 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 

I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2326 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 



2340 



2385 



Qy 2341 AAC AT CAC CAAGGACAC AAGGTTT GCT GAGCTGCT GGCT CT GGAGAGT GAAGC GGGGGTC 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2386 AACAT CAC CAAGGAC ACAAGGTT T GCT GAGCT GCT GGCTCT GGAGAGT GAAGC GGGGGTC 2445 

Qy 2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 24 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2446 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2505 

Qy 2461 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2520 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II 

Db 2506 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2565 

Qy 2521 C AC CT GGACAGC C AT CT CAGCT T CT TT GCCT CCAAGCCCAGC CC CACAGC CAT GAT CCT C 2580 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2566 C AC CT GGACAGCCAT CT CAGCT T CT TT GCCT CCAAGC CCAGCCC CACAGC CAT GAT CCT C 2625 

Qy 2581 AACCT GT GGGAGGCGCGGCACT T CC CCAAC GGCAAC CT CAGCCAGCT GGCT GCAGCAGT G 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 2626 AACCT GT GGGAGGCGCGGCACTT C CC CAAC GGCAAC CT CAGCCAGCT GGCT GCAGCAGT G 2685 

Qy 2641 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2697 

i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 2686 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 
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Query Match 97.2%; Score 2621.4; DB 10; Length 2881; 

Best Local Similarity 98.9%; Pred. No. 0; 

Matches 2673; Conservative 0; Mismatches 21; Indels 9; Gaps 3; 



Qy 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 87 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 146 

Qy 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 147 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 206 

Qy 121 GACCT GCTT CC C CACTT CCT GGT GGAGCCCGAGGAT GTGT ACATC GT CAAGAACAAGC CA 180 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 207 GACCT GCTT CC CCACTT CCT GGTGGAGCCCGAGGAT GTGT ACATCGT CAAGAACAAGCCA 266 

Qy 181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 267 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 326 

Qy 241 TGGGT GCGC C AGGT GGACCACGT GAT CGAGC GCAGCACAGAC GGGAGC AGT GGGCT GC C C 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I III 

Db 327 T GGGT GCGCC AGGT GGACCAC GTGAT CGAGCGCAGCACAGAC GGGAGC AGT GGT GAGCCG 386 

Qy' 301 AC CAT GGAGGT CCGCATTAAT GT CT CAAGGCAGCAGGTC GAGAAGGT GTT CGGGCT GGAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 387 AC CAT GGAGGT C C GCAT TAAT GT CT CAAGGCAGCAGGTC GAGAAGGT GTT C GGGCT GGAG 446 

Qy 361 GAAT ACT GGT GCCAGT GC GT GGC AT GGAGCT CCT C GGGC AC C ACCAAGAGT CAGAAGGC C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 447 GAAT ACT GGT GC CAGT GCGT GGCAT GGAGCT CCT CGGGCACCACCAAGAGT CAGAAGGCC 506 

Qy 421 T ACAT C C GC AT AGC C AGATT GC GCAAGAACTTC GAGCAG GAGC C GCT GGC CAAGGAGGT G 4 80 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 507 T ACAT C CGC AT AGC C AGATT GC GCAAGAACTTCGAGCAGGAGCCGCT GGC CAAGGAGGT G 566 

Qy 481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 567 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 626 

Qy 541 GTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATC 600 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 627 GT GGAGT GGCT C CGGAAC GAGGAC CT GGTGGAC C CGT CC CT GGAC C C CAAT GT AT ACAT C 686 

Qy 601 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 687 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 746 

Qy 661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 747 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 806 

Qy 721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I 

Db 807 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 866 

Qy 781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 867 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 926 

Qy 841 TGT GAGGGGC AGAAT GT C CAGAA AACAGCCTGCGCCACCCTGTGCCCAGTAGACGGC 897 



1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 I 1 1 I I II I I 1 1 1 1 1 1 1 1 

Db 927 TGTGAGGGGCAGAATGTCCATGACCGCACCGTCTCCTCTCTGCTTGTCTCTGTGGACGGC 986 

Qy 898 AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 957 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I 
Db 987 AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 1046 

Qy 958 CGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTG 1017 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 1047 C GTGAGT GCT CT GAC CCAGCACC CC GCAACGGAGGGGAGGAGT GCCAGGGCACT GACCT G 1106 

Qy 1018 GACACC CGCAACTGT ACCAGT GAC CTCT GTGT ACACAGT GCTT CT GGC CCT GAGGAC GT G 1077 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1107 GACACCCGCAACT GT ACCAGT GAC CTCT GTGT ACACAGT GCTT CTGGC CCT GAGGACGT G 1166 

Qy 1078 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1137 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1167 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1226 

Qy 1138 AT C CT C GTTT ATT GCC GGAAGAAGGAGGGGCT GGACT C AGAT GT GGCT GACT CGT CCATT 1197 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1227 AT CCTCGTTTATT GCC GGAAGAAGGAGGGGCT GGACT CAGATGT GGCT GACT CGT CCATT 1286 

Qy 1198 CT CACCT CAGGCTT CCAGC CCGT C AGC AT CAAGC C CAGCAAAGCAGACAAC C C CC AT CT G 1257 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1287 CT CAC CT CAGGCT T C C AGC CCGT C AGCAT CAAGC C CAGCAAAGCAGACAAC C CCCAT CT G 1346 

Qy 1258 CTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1317 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1347 CT CAC CAT C CAGCC GGACCT CAG CACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1403 

Qy 1318 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1377 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1404 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1463 

Qy 137 8 GGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTC 1437 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 1464 GGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTC 1523 

Qy 1438 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 1497 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1524 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 1583 

Qy 1498 TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTC 1557 

I I II I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1584 TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTC 1643 

Qy 1558 CT CAT C CC C C CAGAT GC CAT ACC C C GAGGGAAGAT CT AT GAGAT CT ACCT CAC GCT GCAC 1617 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1644 CT CAT C CC C C CAGAT GC CAT AC C C C GAGGGAAGAT CT AT GAGAT CT ACCT CAC GCT GCAC 1703 

Qy 1618 AAGC C GGAAGACGT GAGGT T GCC C CTAGCT GGCT GT C AGACC CT GCT GAGT C C CAT C GTT 1677 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1704 AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 1763 

Qy 1678 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1737 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 



Db 
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Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1764 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1823 

1738 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1797 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1824 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1883 

1798 TGGG AGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAG 1854 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I 
1884 TGGGAGCAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAG 1943 

1855 CTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGA 1914 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1944 CTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGA 2003 

1915 GAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCC 1974 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
2004 GAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCC 



2063 



1975 



T GCAC CT CCCT CGAGT ACAAC AT C C GGGTCT ACT GC CTGCATGACACCCAC GAT GCACTC 2034 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2064 T GCAC CT CCCT C GAGT ACAACAT C C GGGT CT ACT GC CT GCAT GACACCCAC GAT GC ACT C 



2035 



2124 



2095 



2123 



AAGGAGGT GGT GCAGCT GGAGAAGC AGCT GGGGGGACAGCT GAT CC AGGAGCCACGGGTC 2094 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AAGGAGGT GGT GCAGCT GGAGAAGC AGCT GGGGGGACAGCT GAT C C AGGAGCCAC GGGTC 2183 



CT GC ACTT CAAGGACAGT T AC C ACAACCTGCGCCT AT CCAT C CACGAT GT GCC CAGCT CC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2184 CT GCACTT CAAGGACAGTT AC C ACAACCTGC GC CT AT CCAT C CAC GAT GT GCC CAGCT CC 

2155 CT GT GGAAGAGTAAGCT CCTT GT CAGCT AC CAGGAGAT CC C CTTTT AT CACAT CTGGAAT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2244 CT GT GGAAGAGTAAGCT C CTT GT CAGCT AC CAGGAGAT CC C CTTTT AT CACAT CT GGAAT 

2215 GGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2304 GGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGT 



2275 



2364 



2335 



GACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATC 



AACTTCAACATCACCAAGGACACAAGGTTT GCTGAGCTGCT GGCT CTGGAGAGTGAAGCG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2424 AACTT CAACAT CACCAAGGAC ACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GAAGCG 

2395 GGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
2484 GGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAG 



2455 



2154 



2243 



2214 



2303 



2274 



2363 



2334 



2423 



2394 



2483 



2454 



2543 



2514 



ATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
2544 ATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAG 2603 

2515 AAACTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATG 2574 

I I I I I I I I I I I I I I I I I I I I I I I I II I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2604 AAACTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATG 2663 



Qy 2575 ATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCA 2634 

I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2664 ATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCA 2723 

Qy 2635 GCAGT GGCT GGACT GGGCCAGC C AGAC GCT GGCCT CTT CACAGT GT CGGAGGCTGAGT GC 2694 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 2724 GCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGC 2783 

Qy 2695 TGA 2697 

I I I 

Db 2784 TGA 2786 
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1; 



Qy 



1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 



1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 

Db 4 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 63 

Qy 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 64 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 123 

Qy 121 GACCTGCTT CC CC ACTT CCT GGT GGAGCCCGAGGAT GT GTAC AT C GT CAAGAACAAGC CA 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 124 GAC CTGCTT C C C CACTT CCT GGT GGAGCCCGAGGAT GT GTACAT C GT CAAGAACAAGCCA 183 

Qy 181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 184 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 243 

Qy 241 T GGGTGC GC CAGGT GGACCACGTGATC GAGC GCAGC ACAGAC GGGAGC AGT GGGCT GC CC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 244 T GGGTGCGC CAGGT GGAC CACGT GATCGAGC GCAGCACAGAC GGGAGCAGT GGGCT GCC C 303 

Qy 301 ACC AT GGAGGT CC GC ATTAAT GT CT CAAGGCAGCAGGT C GAGAAGGTGT T C GGGCT GGAG 360 

I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 304 AC CAT GGAGGT CC GC ATTAAT GT CT CAAGGCAGCAGGT C GAGAAGGTGTT C GGGCT GGAG 363 

Qy 361 GAAT ACT GGT GCCAGT GCGT GGCAT GGAGCT C CT C GGGCACCAC CAAGAGT C AGAAGGC C 420 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 364 GAAT ACT GGT G CCAGT GCGT GGCAT GGAGCT CCT C GGGCAC C AC CAAGAGT CAGAAGGCC 423 

Qy 421 TACAT C CGC AT AGC CAGATT GCGCAAGAACTT CGAGCAGGAGCC GCTGGCCAAGGAGGT G 480 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 424 TACAT C C GC AT AGC CTATTT GC GCAAGAACTT CGAGCAGGAGC C GCTGGCCAAGGAGGT G 483 

Qy 481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 484 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 543 

Qy 541 GT GGAGT GGCT CC GGAAC GAGGACCTGGT GGACC CGT CCCT GGAC C CCAAT GTAT ACAT C 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 544 GT GGAGT GGCT CC GGAAC GAGGACCTGGT GGACC C GT C CCT GGAC C CCAAT GTAT ACAT C 603 

Qy 601 ACGC GGGAGCACAGC CT GGT GGT GC GACAGGC CC GC CTT GCT GAC ACGGC CAACT ACAC C 660 

I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 604 AC GC GGGAGCACAGC CT GGT GGT GC GACAGGC CCGCCT T GCT GACACGGC CAACT ACAC C 663 

Qy 661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 664 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 723 

Qy 721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 780 

I I I 

Db 724 GTG 726 

Qy 781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 840 

Db 727 726 

Qy 841 TGT GAGGGGCAGAAT GT C CAGAAAACAGC CT GCGC C ACCCT GT GC CCAGT AGACGGC AGC 900 

I I I I I I I II 



727 



GACGGCAGC 735 



901 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 960 

I I I M I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
736 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 795 

961 GAGT GCT CT GAC C CAGCACCC CGCAAC GGAGGGGAGGAGTGCC AGGGCACT GACCT GGAC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

796 GAGT GCT CT GAC CCAGCACC CCGCAAC GGAGGGGAGGAGTGC CAGGGCACT GAC CT GGAC 855 

1021 ACC CGCAACT GT ACCAGT GAC CT CT GT GTAC ACAGT GCTTCT GGCCCT GAGGACGT GGCC 1080 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I | | | | I I 
856 ACCCGCAACT GT ACCAGT GACCT CT GT GT ACAC ACT GCTTCT GGC CCT GAGGAC GT GGCC 915 

1081 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1140 
I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
916 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 975 

1141 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1200 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
976 CT C GTT T ATT GC C GGAAGAAGGAGGGGCT GGACT CAGAT GT GGCT GACTCGTCCAT TCT C 1035 

1201 ACCT CAGGCTTCCAGC CCGT C AGCAT CAAGC C C AGCAAAGC AGACAACCCC CAT CT GCT C 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1036 ACCT CAGGCT TC C AGC CCGTCAGCAT CAAGCC CAGCAAAGCAGACAAC CC C CAT CT GCT C 1095 

1261 ACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGG 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
1096 ACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGG 1155 

1321 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1156 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1215 

1381 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 1440 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1216 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 1275 

1441 CGC CT CT CCACC C AGAACT ACTTC CGCT CC CT GC C C CGAGGC ACCAGCAACAT GAC CTAT 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1276 C GCCT CT C CACC CAGAACT ACTT C C GCT CC CT GC C C C GAGGC ACCAGCAACAT GACCTAT 1335 

1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1336 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTCCTC 1395 

1561 ATCCCCCCAGAT GCCATACCCCGAGGGAAGAT CT ATGAGATCTAC CT CACGCT GCACAAG 1620 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I 
1396 ATCCCCCCAGAT GCCATACCCCGAGGGAAGATCT ATGAGATCTAC CT CACGCT GCACAAG 1455 

1621 CCGGAAGAC GTGAGGTTGCCCCTAGCT GGCT GTCAGACCCTGCT GAGT CCCATCGTTAGC 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1456 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1515 

1681 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1740 

II I II I II I II II II II I II I III I I III I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
1516 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1575 



Qy 
Db 



1741 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1576 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1635 



Qy 1801 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1860 

I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1636 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1695 

Qy 1861 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1696 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1755 

Qy 1921 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1756 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 1815 

Qy 1981 T CC CT CGAGT ACAACAT CCGGGT CT ACT GCCT GCAT GACACCC ACGATGCACT CAAGGAG 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1816 T CC CT CGAGT ACAACAT CCGGGT CT ACT GCCTGCAT GACAC CCACGAT GCACT CAAGGAG 1875 

Qy 2041 GT GGT GCAGCT GGAGAAGCAGCT GGGGGGACAGCT GAT CCAGGAGC CAC GGGT CCT GCAC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db .1876 GTGGTGCAGCTGGAGAAGCAGCT GGGGGGACAGCT GAT CCAGGAGCCACGGGTCCTGCAC 1935 

Qy 2101 T T CAAGGACAGTT AC CACAACCT GC GC CT AT C CAT C CACGATGT GC C CAGCT CC CT GT GG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1936 TTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGG 1995 

Qy 2161 AAGAGTAAGCT CCT T GT CAGCT AC C AGGAGAT C C C CT TTT ATC ACAT CTGGAATGGCACG 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1996 AAGAGTAAGCT C CT T GT CAGCT AC C AGGAGAT C C CCT TTT AT CACAT CT GGAAT GGCACG 2055 

Qy 2221 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2280 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 2056 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2115 

Qy 2281 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2116 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2175 

Qy 2341 AACAT CAC CAAGGACACAAGGTTT GCT GAGCT GCT GGCTCT GGAGAGT GAAGC GGGGGTC 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2176 AACAT CAC CAAGGAC ACAAGGT T T GCT GAGCTGCT GGCTCT GGAGAGT GAAGCGGGGGTC 2235 

Qy 2401 CCAGC CCT GGT GGGC CCCAGT GC CTT CAAGAT CCCCT T CCT CAT T C GGCAGAAGATAATT 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2236 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2295 

Qy 2461 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 2296 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2355 

Qy 2521 CAC CT GGACAGC CAT CT CAGCTT CT TT GCCT C CAAGCC CAGC C C C AC AGCCAT GAT C CT C 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2356 CAC CT GGACAGC C AT CT CAGCTT CTTT GCCT C CAAGCCCAGCC C C AC AGC CAT GAT C CT C 2415 



Qy 

Db 



2581 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2640 

I I I I I I I t I I I I I I U I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2416 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2475 



Qy 2641 GCT GGACT GGGCCAGC CAGAC GCT GGC CT CTT CACAGT GT CGGAGGCT GAGT GCT GA 2697 

I I I I II I I I I I I I I I II I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 2476 GCT GGACT GGGCCAGC CAGAC GCT GGCCT CTT CACAGT GT CGGAGGCT GAGT GCT GA 2532 
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QY 
Db 



1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I I I I I I I I I I I I I I I I I I I I I I I III III I I I I I I I I II I I II I I I I I I I I I I I I I I I I 
4 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 63 



Qy. 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 64 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 123 

Qy 121 GACCTGCTT CCCCACTTC CTGGT GGAGC CC GAGGAT GT GT ACAT C GT CAAGAACAAGC CA 180 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 1 1 I I I I I I I I 1 1 I I I I I I 

Db 124 GAC CTGCTT C CC CACTT C CTGGT GGAGCCC GAGGAT GT GT AC AT C GT CAAGAACAAGCC A 183 

Qy 181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 24 0 

I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 184 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 243 

Qy 241 T GGGT GC GC CAGGTGGAC CACGT GAT C GAGC GCAGCACAGAC GGGAGCAGT GGGCT GC CC 300 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 244 TGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCC 303 

Qy 301 ACC ATGGAGGTCCGC ATT AAT GTCT CAAGGCAGCAGGT C GAGAAGGT GTT C GGGCT GGAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 304 ACCATGGAGGTCCGC ATT AAT GTCT CAAGGCAGCAGGT CGAGAAGGT GTT C GGGCT GGAG 363 

Qy 361 GAAT ACT GGT GC CAGT GC GT GGCAT GGAGCT C CT CGGGCAC CACCAAGAGT CAGAAGGCC 420 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 364 GAAT ACT GGT GC CAGT GCGT GGCAT GGAGCT C CT CGGGCAC CAC CAAGAGT CAGAAGGCC 423 

Qy 421 T AC AT CC GCAT AGCCAGATTGC GCAAGAACT T CGAGCAGGAGCC GCT GGCCAAGGAGGT G 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 424 T ACAT CC GCAT AGCCTATTTGC GCAAGAACT T C GAGCAGGAGCC GCT GGCCAAGGAGGT G 4 83 

Qy 481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 54 0 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 4 84 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 543 

Qy 541 GT GGAGT GGCT C C GGAAC GAGGAC CT GGT GGAC C C GTC C CT GGAC CC CAAT GT AT ACAT C 600 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 544 GT GGAGT GGCT C C GGAAC GAGGACCT GGT GGAC C CGT CC CT GGACCC CAAT GT AT ACAT C 603 

Qy 601 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 604 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 663 

Qy 661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 664 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 723 

Qy 721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 780 

I I I 

Db 724 GTG 726 

Qy 781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 840 

Db 727 726 

Qy 841 TGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGC 900 

I I I I II I I I 

Db 727 GACGGCAGC 735 



Qy 901 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 960 

I I I I I I I I I I I I I I I i I I I I I I I I I I II I I I I I I I I I i II I I I I I I I I I I M I I I I I I I I 

Db 736 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 795 

Qy 961 GAGT GCT CT GACC C AGCACCCCGCAACGGAGGGGAGGAGT GCCAGGGCACT GACCT GGAC 1020 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 796 GAGT GCT CT GACC CAGCACCC CGCAAC GGAGGGGAGGAGTGCCAGGGCACT GACCTGGAC 855 

Qy 1021 ACCCGCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 856 AC CCGCAACT GT ACC AGT GACCT CTGT GT ACAC ACT GCT T CTGGCC CT GAGGACGT GGCC 915 

Qy 1081 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 916 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 975 

Qy 1141 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1200 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 97 6 CT C GT TT AT TGC CGGAAGAAGGAGGGGCT GGACTCAGAT GT GGCTGACT CGT C CATT CT C 1035 

Qy 1201 AC CT C AGGCTT C C AGCC C GT CAGCATCAAGCC CAGCAAAGCAGACAAC CCC CAT CT GCTC 1260 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1036 ACCT CAGGCTT C CAGCCCGT C AGCATCAAGC C CAGCAAAGCAGACAACC C C CAT CT GCT C 1095 

Qy 1261 AC CAT CC AGCC GGACCT CAGC ACCACC AC CAC CAC CT AC C AGGGCAGT CT CT GT C C C C GG 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 1096 AC CAT CC AGCC GGACCT CAGC ACCACC AC CAC CAC CT AC CAGGGCAGT CT CT GT CC C C GG 1155 

Qy 1321 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1380 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 1156 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1215 

Qy 1381 GGCGGCC GC CAC ACACT GCAC CAC AGCT CTC CCACCT CT GAGGC CGAGGAGT T C GT CT CC 1440 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 1216 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 1275 

Qy 1441 CGCCT CT CCAC C C AGAACT ACTT C C GCT C CCT GC CC C GAGGCAC C AGCAACAT GAC CT AT 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 1276 CGCCT CT CCAC C CAGAACT ACTT C C GCT C C CT GC C CCGAGGCACCAGCAACAT GAC CTAT 1335 

Qy 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1336 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTCCTC 1395 

Qy 1561 AT C C CCC CAGAT GCC AT ACC CCGAGGGAAGAT CTAT GAGAT CT ACCT CACGCT GCACAAG 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1396 ATCCCCCCAGAT GCCATACCCCGAGGGAAGAT CTAT GAGAT CTACCTCACGCT GCACAAG 1455 

Qy 1621 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCT GCT GAGT CCCATCGTTAGC 1680 

I I I II I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1456 CCGGAAGACGTGAGGTT GCC CCTAGCTGGCTGTCAGACCCTGCT GAGT CCCATCGTTAGC 1515 

Qy 1681 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1740 

I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I II I I I I I I I I I I I I I I I I II I I I 

Db 1516 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1575 

Qy 1741 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1800 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1576 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1635 

Qy 1801 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 1636 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1695 

Qy 1861 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 1696 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1755 

Qy 1921 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1756 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 1815 

Qy 1981 T CCCTCGAGTACAACATCCGGGT CTACTGCCTGCAT GACACCCACGAT GCACT CAAGGAG 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1816 T C CCT CGAGT ACAAC AT C C GGGT CT ACT GC CT GCAT GACACC CACGAT GCACT CAAGGAG 1875 

Qy 2041 GT GGT GCAGCT GGAGAAGC AGCT GGGGGGAC AGCT GAT CCAGGAGC CACGGGT CCT GCAC 2100 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 1876 GTGGT GCAGCT GGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCAC 1935 

Qy 2101 TTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGG 2160 

I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1936 TT CAAGGACAGTT AC CACAAC CT GCGC CT AT CCAT CC ACGAT GT GC C C AGCT C CCT GT GG 1995 

Qy 2161 AAGAGTAAGCT CCTT GT CAGCT AC CAGGAGAT C C CCTTTTAT CACAT CTGGAAT GGCACG 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1996 AAGAGTAAGCT CCTT GT CAGCT AC CAGGAGAT CC CCTTTTAT CACAT CTGGAAT GGCAC G 2055 

Qy 2221 CAGC GGT ACTT GCACT GCAC CT T CACC CT GGAGC GT GT CAGC C C CAGCACT AGT GAC CT G 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 2056 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2115 

Qy 2281 GCCTGCAAGCTGT GGGT GTGGCAGGTGGAGGGC GAC GGGCAGAGCTTCAGCATCAACTTC 2340 

I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I II I I I I I II II I I I I I I I I I I I I 
Db 2116 GCCT GCAAGCT GTGGGT GT GGC AGGT GGAGGGC GAGGGGCAGAGCTT CAGCAT CAACTT C 2175 

Qy 2341 AACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTC 2400 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I 
Db 2176 AACAT CAC CAAGGACACAAGGTTT GCT GAGCTGCT GGCTCT GGAGAGT GAAGCGGGGGT C 2235 

Qy 2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db . .2236 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2295 

Qy 2461 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2296 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2355 

Qy 2521 C ACCT GGACAGC CAT CT CAGCTT CTTT GCCT CCAAGCCCAGCCC CACAGC CAT GAT C CTC 2580 

I I I I I I I I I I I I I I I I I I I I II II I I I I I I II I I I II I I I II I I I I I I I I I I I I I I I I I I 
Db 2356 CACCT GGACAGC CAT CT CAGCT T CTTT GCCT C CAAGCCC AGC C C CACAGC CAT GAT C CTC 2415 

Qy 2581 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2640 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 2416 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2475 

Qy 2641 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2697 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 2476 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2532 
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ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
ATGGCCGTCCGGCCCGGCCTGTGGCCAGTGCTCCTGGGCATAGTCCTCGCCGCCTGGCTT 60 

CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
CGTGGTTCGGGTGCCCAGCAGAGTGCCACGGTGGCCAATCCAGTGCCCGGTGCCAACCCC 120 

GAC CTGCTT CC CCACT T C CT GGT GGAGCC CGAGGAT GT GTAC AT C GT CAAGAACAAGCCA 180 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GAC CTGCT GCC CCACT T C CT GGT AGAGCCT GAGGACGT GTAC ATT GT CAAGAACAAGCC G 180 

GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 24 0 

III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
GTGTTGTTGGTGTGCAAGGCTGTGCCTGCCACCCAGATCTTCTTCAAGTGCAATGGGGAA 24 0 

T GGGTGCGCC AGGT GGAC CAC GT GATC GAGC GCAGCACAGACGGGAGCAGT GGGCT GC C C 300 
I I II I I I I I I I I I II I I I I I II II MINIM III I I I I I I II I I I I 
T GGGT C C GCC AGGT C GAT CACGT AATT GAAC GCAGCACCGACAGCAGCAGCGGATT GC CA 300 

AC CATGGAGGT CCGCAT T AAT GT CT CAAGGCAGC AGGT CGAGAAGGT GT T C GGGCT GGAG 360 
I I I I I I I I I I I I I I II II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AC CATGGAGGT CCGT AT CAACGT AT CGAGGCAGC AG GT AGAGAAAGTGT TT GGGCT GGAG 360 



Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



361 GAAT ACTGGT GCCAGT GCGTGGCAT GGAGCT C CTCGGGC ACCAC CAAGAGT C AGAAGGC C 420 

I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I II I I I I I I I 

361 GAAT ACTGGT GCCAGT GT GT GGCAT GGAGCT C CTCGGGT ACCAC CAAAAGTCAGAAGGC C 420 

421 T AC AT CCGCATAGCCAGATT GCGCAAGAACTT CGAGCAGGAGCC GCTGGC CAAGGAGGT G 480 

I I I I I I I I II III I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

421 T ACAT C CGGATT GCCTATTT GCGCAAGAACTT T GAGC AGGAGC C ACT GGC CAAGGAAGT G 480 

4 81 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

II I I I I I I I I I I I I I II II II II II II II II II I I I I I I I I I I III 

481 T C ACT GGAGCAAGGCATT GT ACT ACCTT GT CGCC C CC CAGAAGGAATCC C CC C AGCT GAG 540 

541 GT GGAGT GGCTC CGGAAC GAGGACCTGGT GGACCCGT C C CTGGACCCCAAT GT AT AC AT C 600 

I II I I II I II I II II I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I 

541 GT GGAGT GGCTT CGAAAT GAGGAC CTC GT GGACCCCT CC CTCGATC CCAAT GT GT AC AT C 600 

601 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 660 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I II II 

601 ACGCGGGAGCACAGCCTAGTCGTGCGTCAGGCCCGCCTGGCCGACACGGCCAACTACACC 660 

661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

II I I I I I I I I I I I I I I I I I II I I I I I I II III II I I II II I I I I I II II 

661 TGTGTGGCCAAGAACATCGTAGCCCGTCGCCGAAGCACCTCTGCAGCGGTCATTGTTTAT 720 

721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 780 

I I I I I I I I I II I I I I I II I I I I II I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I 

721 GTGAACGGTGGGTGGTCGACGTGGACTGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGT 780 

781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 840 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCACCTCTCAACGGGGGCGCCTTC 840 

841 T GT GAGGGGCAGAAT GT C CAGAAAAC AG C CT GCGC C AC C CT GT GCCCAGT AGACGGC AGC 900 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II III 

841 T GT GAGGGGCAGAAT GT C CAGAAAACAGCCT GCGCCACTCT GT GCCCAGT GGAT GGGAGC 900 

901 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 960 

I I I II I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

901 TGGAGTTCGTGGAGTAAGTGGTCAGCCTGTGGGCTTGACTGCACCCACTGGCGGAGCCGC 960 

961 GAGT GCTCT GAC C C AGC AC CC CGCAACGGAGGGGAGGAGT GCC AGGGCACT GAC CT GGAC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I III I I I I I I I I I I I 

961 GAGTGCTCTGACCCAGCACCCCGCAATGGAGGTGAGGAGTGTCGGGGTGCTGACCTGGAC 1020 

1021 AC CC GCAACT GTAC CAGT GAC CT CT GT GT AC ACAGT GCTT CT GGCC CT GAGGAC GT GGC C 1080 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1021 ACCCGCAACTGTACCAGTGACCTCTGCCTGCACACCGCTTCTTGCCCCGAGGACGTGGCT 1080 

1081 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1081 CTCTACATCGGCCTTGTCGCTGTGGCTGTGTGCCTCTTCTTGCTGTTGCTGGCCCTTGGA 1140 

1141 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1200 

III I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
1141 CTCATTTACTGTCGCAAGAAGGAAGGGCTGGACTCCGATGTGGCCGACTCGTCCATCCTC 1200 



Qy 1201 ACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCATCTGCTC 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 1201 ACCT CGGGCTT CCAGC CT GT C AGCATCAAGCCCAGCAAAGCAGACAACC CCC ACCT GCTC 1260 

Qy 1261 AC C ATC C AGC C GGAC CT C AGCACCACCACCACCACCT ACCAGGGCAGT CT CT GTC C C CGG 1320 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II 

Db 1261 AC CAT C CAGCCAGACCT CAGCACCACCACT AC CACCT ACCAGGGCAGT CT AT GTT CGAGG 1320 

Qy 1321 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1380 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1321 CAGGATGGACCCAGCCCCAAGTTCCAGCTCTCTAATGGTCACCTGCTCAGCCCACTGGGG 1380 

Qy 1381 GGCGGCC GCCACACACT GCAC CACAGCT CT C C CAC CT CT GAGGCCGAGGAGT T CGT CTCC 1440 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 AGTGGCCGCCATACGTTGCACCACAGCTCACCCACCTCTGAGGCTGAGGACTTCGTCTCC 1440 

Qy 1441 C GCCT CT CCACCCAGAACTACTT C CGCT C C CT GCCCC GAGGCAC C AGCAACAT GAC CTAT 1500 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II 1.1 I I 

Db 1441 CGCCTCTCCACCCAAAACTACTTTCGTTCCCTGCCCCGCGGCACCAGCAACATGGCCTAC 1500 

Qy 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACGGGGATCAGCCTCCTC 1560 

Qy 1561 AT C C C CCCAGAT GCCAT AC CC CGAGGGAAGAT CTAT GAGAT CT AC CT C AC GCT GCACAAG 1620 

II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 AT AC CCCCGGAT GCCAT C CCC CGAGGAAAGAT CT AC GAGAT CT ACCTCAC ACT GCACAAG 1620 

Qy 1621 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1680 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 CC AGAAGAC GT GAGGTT GCCCCT AGCT GGCT GTCAGAC C CT GCT GAGT CCAGT CGTT AGC 1680 

Qy 1681 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1740 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II 

Db 1681 TGTGGGCCCCCAGGAGTCCTGCTCACCCGGCCAGTCATCCTTGCAATGGACCACTGTGGA 174 0 

Qy 1741 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 1741 GAGCCCAGCCCTGACAGCTGGAGTCTGCGCCTCAAAAAGCAGTCCTGCGAGGGCAGTTGG 1800 

Qy 1801 GAGGAT GT GCT GCAC CTGGGCGAGGAGGCGCCCT CCCACCTCTACT ACT GCC AGCT GGAG 1860 

I I I I I I I I I I II I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1801 GAGGAT GTGCT GC ACCT T GGT GAGGAGT CAC CTT CCCACCT CT ACT ACT GCCAGCT GGAG 1860 

Qy 1861 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1920 

III I II Mil II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ■ 
Db 1861 GCCGGGGCCTGCTATGTCTTCACGGAGCAGCTGGGCCGCTTTGCCCTGGTAGGAGAGGCC 1920 

Qy 1921 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I II I I I I I I I I II 

Db 1921 CTCAGCGTGGCTGCCACCAAGCGCCTCAGGCTCCTTCTGTTTGCTCCCGTGGCCTGTACG 1980 

Qy 1981 TCC CTCGAGT ACAACAT CCGGGT CT ACT GC CT GC AT GAC AC C CACGAT GCACT CAAGGAG 2040 

I I I I I I I I I I I II I I I I I I II I I I I I I I I II I I I I I I I I I II II I I I I I I I I I 

Db 1981 TC CCT T GAGT ACAACAT C C GAGT GT ACT GC CT ACAC GACAC C C AC GACGCT CT CAAGGAG 2040 

Qy 2041 GTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCAC 2100 



Db 



I I i I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I II II I I I I I I I 
2041 GT GGT GCAGCT GGAGAAGC AGCT AGGT GGACAGCT GAT CC AGGAGC CT CGC GT CCT GCAC 



2100 



Qy 2101 TTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGG 2160 

I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I II I I I I I I I I I II I I 
Db 2101 TTCAAAGACAGTTACCACAACCTACGTCTCTCCATCCACGACGTGCCCAGCTCCCTGTGG 2160 

Qy 2161 AAGAGTAAGCT C CT T GT C AGCT ACCAGGAGAT C C CCTT TT ATCACAT CT GGAAT GGCACG 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 AAGAGCAAGCT ACTT GT C AGCT ACCAGGAGAT CC CT TTTT AC CACAT CT GGAAC GGCACC 2220 

Qy 2221 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2280 

I I I I III I I I I I I I I I I I I I II I I I II I I I I I III I I I I I I I I II I I I I I I 
Db 2221 CAGC AGT ATCT GCACTGCAC CT T C ACCCTGGAGCGCAT CAACGC CAGCAC CAGC GACCT G 2280 

Qy 2281 GC CT GCAAGCT GTGGGT GTGGCAGGTGGAGGGC GACGGGCAGAGCTT CAGCAT CAACTTC 2340 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GCCTGCAAGGTGTGGGTGTGGCAGGTGGAGGGAGATGGGCAGAGCTTCAACAT CAACTTC 234 0 

Qy 2341 AACAT CAC CAAGGACACAAGGTT T GCT GAGCT GCT GGCT CT GGAGAGT GAAGCGGGGGTC 2400 

I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I II I I I I I 
Db 2341 AACAT CACTAAGGACACAAGGTTT GCT GAATTGTT GGCT CT GGAGAGT GAAGGGGGGGTC 2400 

Qy 2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I II I I I I I I I I I I I I I I I I I II 
Db 2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAAAAGATCATC 2460 

Qy 2461 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2520 

I I I I II I I I I I I I I I I I I II I I II I I I I I I I I I I I II II I I I I I I I I I I I I 
Db 2461 GCCAGTCTGGACCCACCCTGCAGCCGGGGCGCCGACTGGAGAACTCTAGCCCAGAAACTT 2520 

Qy 2521 CACCT GGACAGC CAT CT C AGCTT CT TT GCCT CCAAGCC CAGCC C C ACAGC C AT GAT CCT C 2580 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 CACCTGGACAGCCATCTTAGCTTCTTTGCCTCCAAGCCCAGCCCTACAGCCATGATCCTC 2580 

Qy 2581 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2640 

I I I I I I I I I I I I I I I I I I I II I I I I I I I II I II I I II I I I I I I I II I I I I I I III 
Db 2581 AACCTATGGGAGGCACGGCACTTCCCCAACGGCAACCTCGGCCAGCTGGCAGCAGCTGTG 2640 

Qy 2641 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2697 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I Mill III 
Db 2641 GCCGGACTGGGCCAACCAGATGCTGGCCTCTTCACGGTGTCGGAGGCCGAGTGTTGA 2697 



RESULT 7 
US-09-933-261-1 

; Sequence 1, Application US/09933261 
; Publication No. US20030040046A1 

GENERAL INFORMATION: 
; APPLICANT: Tessier-Lavigne, Marc 

; Leonardo , E . David 

; Hink, Lindsay 

; Masu, Masayuki 

; Kazuko, Keino-Masu 

TITLE OF INVENTION: Netrin Receptors 
; NUMBER OF SEQUENCES : 8 

CORRESPONDENCE ADDRESS: 



ADDRESSEE: SCIENCE & TECHNOLOGY LAW GROUP 

STREET: 268 .BUSH STREET, SUITE 3200 

CITY: SAN FRANCISCO 

STATE: CALIFORNIA 

COUNTRY: USA 

ZIP: 94104 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 

COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.30 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/09/933,261 

FILING DATE: 20-Aug-2001 

CLASSIFICATION: <Unknown> ' 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 08/808,982 
; FILING DATE: <Unknown> 

ATTORNEY/ AGENT INFORMATION: 
NAME: OSMAN, RICHARD A 
; REGISTRATION NUMBER: 36,627 

; REFERENCE/ DOCKET NUMBER: UC96-217 

TELECOMMUNICATION INFORMATION: 
TELEPHONE: (415) 343-4341 
TELEFAX: (415) 343-4342 
INFORMATION FOR SEQ ID NO: 1: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 3014 base pairs 
; TYPE: nucleic acid 

STRANDEDNESS: double 
TOPOLOGY: linear 
MOLECULE TYPE: cDNA 

SEQUENCE DESCRIPTION: SEQ ID NO: 1: 
US-09-933-261-1 

Query Match 83.5%; Score 2252.2; DB 10; Length 3014; 

Best Local Similarity 89.7%; Pred. No. 0; 

Matches 2419; Conservative 0; Mismatches 278; Indels 0; Gaps 0; 



Qy 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGTGCTCCTGGGCATAGTCCTCGCCGCCTGGCTT 60 

Qy 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

II II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

..Db 61 CGTGGTTCGGGTGCCCAGCAGAGTGCCACGGTGGCCAATCCAGTGCCCGGTGCCAACCCC 120 

Qy 121 GAC CT GCT TC C CCACT T C CT GGT GGAGC C C GAGGAT GT GT ACAT CGT CAAGAACAAGCC A 180 

I I I I I I I I II I I I I II I I I I I I I I I II I II I I I I I I I II I I I I I I I I I I I I I II 

Db 121 GACCTGCTGCCCCACTTCCTGGTAGAGCCTGAGGACGTGTACATTGTCAAGAACAAGCCG 180 

Qy 181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

Ml II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 GTGTTGTTGGTGTGCAAGGCTGTGCCTGCCACCCAGATCTTCTTCAAGTGCAATGGGGAA 240 

Qy 241 TG GGT GCGCC AGGT GGACCAC GT GAT CGAG CGC AGCACAGACGGGAGCAGT GGGCTGCCC 300 

II I I I MINIM II Mill II II I M I M II III I Mill M I I I I 



Db 



241 TGGGT CCGCCAGGT C GAT CAC GTAATT GAAC GC AGC ACCGACAGC AGCAGCGGATT GCC A 300 



Qy 301 ACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAG 360 

I I I I I I I I I I I I I I II II II II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 301 AC CAT GGAGGT CCGT AT CAACGT AT C GAGGCAGC AGGTAGAGAAAGTGTTT GGGCT GGAG 360 

Qy 361 GAAT ACTGGT GCCAGT GC GT GGC AT GGAGCT CCT CGGGCACCAC CAAGAGT C AGAAGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 361 GAATACTGGTGCCAGT GT GT GGCAT GGAGCT C CT CGGGT ACCACCAAAAGTCAGAAGGCC 420 

Qy 421 TACAT CCGC AT AGCCAGATT GC GCAAGAACTT CGAGCAGGAGCC GCT GGCCAAGGAGGT G 480 

I I I I I I I I II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II II III 

Db 421 TACAT CCGGATT GCCT AT TT GC GCAAGAACTTT GAGCAGGAGCCACT GGC CAAGGAAGT G 480 

Qy 481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 54 0 

II I I I I I I I I I I I I I II II II II I I II II II II II I I I I I I I I III 

Db 481 T C ACT GGAGCAAGGCATT GT ACT AC CTT GT C GC C CC CCAGAAGGAAT C C CCCCAGCT GAG 540 

Qy 541 GTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATC 600 

I I I II I I I I I I II II I I I I I I I I I I I I I I II I I I II II I I I I I I I I I I I I I I 

Db 541 GT GGAGTGGCTT CGAAAT GAGGAC CT C GT GGAC C CCT CC CTC GAT C CCAAT GT GT ACAT C 600 

Qy 601 AC GCGGGAGCACAGC CT GGT GGT GC GAC AGG C C C GC CTT GCT GACACGGC CAACT ACAC C 660 

I I I II I I I I I I I II I II II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 601 ACGCGGGAGCACAGCCTAGTCGTGCGTCAGGCCCGCCTGGCCGACACGGCCAACTACACC 660 

Qy 661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGC GCCT CCGCT GCT GT CAT CGTCTAC 720 

II I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I II II I I I II II II 

Db 661 T GT GT GGCCAAGAACAT C GT AGCC C GT C GC C GAAGC ACCT CT GCAGCGGT CATT GTTT AT 720 

Qy 721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I 

Db 721 GTGAACGGTGGGTGGTCGACGTGGACTGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGT 780 

Qy 781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 840 

I I I I I I I I I II I I I I I I I I I I II I I I I I II I I I II I II I I I I I II I I I I I I I I I I III 

Db 781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCACCTCTCAACGGGGGCGCCTTC 840 

Qy 841 T GT GAGGGGCAGAAT GT CCAGAAAAC AGC CT GC GCCACC CT GT GC C CAGT AGAC GGCAGC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I II II III 

Db 841 T GT GAGGGGCAGAAT GT CCAGAAAACAGC CT GC GCCACT CTGT GC CC AGT GGAT GGGAGC 900 

Qy 901 TGGAGCCCGTGGAGCAAGT GGT C GGC CTGT GGGCT GGACTGCACCCACT GGC GGAGCCGT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 901 TGGAGTTCGTGGAGTAAGTGGTCAGCCTGTGGGCTTGACTGCACCCACTGGCGGAGCCGC 960 

Qy 961 GAGT GCT CTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACT GAC CT GGAC 1020 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I 

Db 961 GAGT GCTCT GACC CAGCAC CC C GCAAT GGAGGT GAGGAGT GT C GGGGT GCT GACCT GGAC 1020 

Qy 1021 AC CCGCAACTGT ACCAGT GACCT CT GT GTAC AC AGT GCT T CT GGCCCT GAGGACGT GGC C 1080 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 1021 ACCCGCAACT GTAC CAGT GAC CTCT GCCT GCACACCGCTT CTT GCCCC GAGGACGT GGCT 1080 

Qy 1081 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1140 

I II II I I I I I I 111 I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 1081 CTCTACATCGGCCTTGTCGCTGTGGCTGTGTGCCTCTTCTTGCTGTTGCTGGCCCTTGGA 1140 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 
Db 



1141 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1200 

III I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
1141 CTCATTTACTGTCGCAAGAAGGAAGGGCTGGACTCCGATGTGGCCGACTCGTCCATCCTC 1200 

1201 AC CTC AGGCTT C CAGCC C GT CAGC ATCAAGC CCAGCAAAGCAGACAAC CCCCAT CT GCT C 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
1201 ACCTCGGGCTTCCAGCCTGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCACCTGCTC 1260 

1261 ACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGG 1320 

I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I III I II 
1261 ACCAT CCAGC C AGAC CT CAGC ACCACC ACTAC CAC CT ACCAGGGCAGT CT ATGT T CGAGG 1320 

1321 C AGGAT GGGC C CAGC CCCAAGT T CCAGCTCAC CAAT GGGCACCT GCT CAGCCC C CT GGGT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 CAGGATGGACCCAGCCCCAAGTTCCAGCTCTCTAATGGTCACCTGCTCAGCCCACTGGGG 1380 

1381 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 1440 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 AGTGGCCGCCATACGTTGCACCACAGCTCACCCACCTCTGAGGCTGAGGACTTCGTCTCC 144 0 

1441 C GC CT CT CCACC CAGAACT ACTT C C GCT CCCT GC CC C GAGGCAC CAGCAACAT GAC CT AT 1500 

I I I I I I I I I I I I I I I I I II I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
1441 CGCCTCTCCACCCAAAACTACTTTCGTTCCCTGCCCCGCGGCACCAGCAACATGGCCTAC 1500 

1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1560 

I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I 
1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACGGGGATCAGCCTCCTC 1560 

1561 AT CC CCC CAGAT GCCAT AC C CC GAGGGAAGAT CT AT GAGAT CTACCT CAC GCT GCACAAG 1620 

II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
1561 AT AC C CC CGGAT GC CAT CCC CC GAGGAAAGAT CT AC GAGAT CTACCT CAC ACT GCACAAG 1620 

1621 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1680 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1621 CCAGAAGACGT GAGGTT GCC C CT AGCT GGCT GT CAGACCCT GCT GAGT CCAGT CGT T AGC 1680 

1681 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1740 

I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I II II I I I I II I I I I I I II 
1681 TGTGGGCCCCCAGGAGTCCTGCTCACCCGGCCAGTCATCCTTGCAATGGACCACTGTGGA 1740 

1741 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1800 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
1741 GAGCCCAGCC CTGACAGCTGGAGT CTGC GCCT CAAAAAGCAGT CCTGC GAGGGCAGT T GG 1800 

1801 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1860 

I I I I I I I I I II I I I I II II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 GAGGAT GT GCT GCAC CT T GGT GAGGAGT CACCT T C C CACCT CT ACT ACT GC CAGCT GGAG 1860 

1861 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1920 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1861 GCCGGGGCCTGCTATGTCTTCACGGAGCAGCTGGGCCGCTTTGCCCTGGTAGGAGAGGCC 1920 

1921 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I II I I I I I I I I II 

1921 CTCAGCGTGGCTGCCACCAAGCGCCTCAGGCTCCTTCTGTTTGCTCCCGTGGCCTGTACG 1980 



Qy 1981 T CCCT CGAGT ACAAC AT CCGGGT CT ACT GCCT GCAT GACACCCACGAT GCACT CAAGGAG 2040 

I 11 I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I II I I LI I I I I I 

Db 1981 T CCCTT GAGT ACAAC AT CCGAGT GT ACT GCCT ACACGACACCCACGAC GCT CTCAAGGAG 2040 

Qy 2041 GT GGT GCAGCTGGAGAAGCAGCTGGGGGGACAGCT GAT C CAGGAGCCACGGGT C CT GCAC 2100 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I 

Db 2041 GT GGT GCAGCT GGAGAAGCAGCT AGGTGGACAGCT GAT C CAGGAGC CT CGC GT C CT GCAC 2100 

Qy 2101 T T CAAGGAC AGTT ACCACAAC CT GCGCCT AT CCAT CCAC GAT GT GCCC AGCT C C CT GTGG 2160 

I I I II I I I I I I I I I I I I I I I I I II II I I I I 1 I I I I I I I I I I I I I I I I.I I I I I I I I 

Db 2101 TTCAAAGAC AGTT AC C AC AACCT ACGTCT CT CCATC CACGACGT GCCCAGCT CC CTGT GG 2160 

Qy 2161 AAGAGTAAGCTC CTT GT CAGCTACCAGGAGATC CCCTTTT AT C ACAT CT GGAAT GGCAC G 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 2161 AAGAGCAAGCTACTT GT CAGCTACCAGGAGAT C C CTTTTT AC C ACAT CT GGAACGGCAC C 2220 

Qy 2221 CAGC GGTACT TGCACT GCAC CTT CACCCT GGAGCGT GT CAGCCC CAGC ACT AGT GACCT G 2280 

I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I III I I I II I I I II I I I I I I 

Db 2221 CAGC AGT AT CT GCACT GCAC CTT CACCCT GGAGCGCAT CAACGC CAGCACCAGCGACCT G 2280 

Qy 2281 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2340 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I 11 II I I I II I I I I I I I I I I I I I 

Db 2281 GC CT GCAAGGT GT GGGT GT GGCAGGT GGAGGGAGAT GGGC AGAGCTT CAACAT CAACT T C 2340 

Qy 2341 AACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTC 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I II I I I I I I I I I I I I I I I I I I I 

Db 2341 AACAT CACT AAGGAC ACAAGGTTT GCT GAAT T GTT GGCT CT GGAGAGT GAAGGGGGGGT C 2400 

Qy 2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 24 60 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II 

Db 2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAAAAGATCATC 2460 

Qy 2461 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2520 

I I I I I I II I I I I I I II I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2461 GCCAGTCTGGACCCACCCTGCAGCCGGGGCGCCGACTGGAGAACTCTAGCCCAGAAACTT 2520 

Qy 2521 CACCT GGACAGC C AT CT CAGCTT CTTT GCCTCCAAGC CCAGC C C CAC AGC CAT GAT C CT C 2580 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2521 CACCT GGACAGC CAT CT T AGCTT CTTT GCCT CCAAGCCCAGCC CTACAGC CAT GAT C CT C 2580 

Qy 2581 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I III 

Db 2581 AACCTATGGGAGGCACGGCACTTCCCCAACGGCAACCTCGGCCAGCTGGCAGCAGCTGTG 2640 

Qy 2641 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCT GAGT GCT GA 2697 

II I I I I I I I I I I I IN II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 2641 GCCGGACTGGGCCAACCAGATGCTGGCCTCTTCACGGTGTCGGAGGCCGAGTGTTGA 2697 



RESULT 8 
US-10-256-702-1 

; Sequence 1, Application US/10256702 
; Publication No. US20030059859A1 
GENERAL INFORMATION: 

APPLICANT: Tessier-Lavigne, Marc 
; Leonardo , E. David 

; Hink, Lindsay 



; Masu, Masayuki 

; Kazuko, Keino-Masu 

TITLE OF INVENTION: Netrin Receptors 
NUMBER OF SEQUENCES: 8 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: SCIENCE & TECHNOLOGY LAW GROUP 
STREET: 268 BUSH STREET, SUITE 3200 
CITY: SAN FRANCISCO 
STATE: CALIFORNIA 
COUNTRY: USA 
ZIP: 94104 
COMPUTER READABLE FORM: 
; MEDIUM TYPE: Floppy disk 

; COMPUTER: IBM PC compatible 

; OPERATING SYSTEM: PC-DOS/MS-DOS 

; SOFTWARE: Patentln Release #1.0, Version #1.30 

CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/ 10/256, 7 02 
; FILING DATE: 27-Sep-2002 

; CLASSIFICATION: <Unknown> 

PRIOR APPLICATION DATA: 
; APPLICATION NUMBER: US/09/933,261 

; FILING DATE: 20-Aug-2001 

; APPLICATION NUMBER: 08/808,982 

; FILING DATE: <Unknown> 

; ATTORNEY/AGENT INFORMATION: 

NAME: OSMAN, RICHARD A 
REGISTRATION NUMBER: 36,627 
REFERENCE/ DOCKET NUMBER: UC96-217 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (415) 343-4341 
TELEFAX: (415) 343-4342 
INFORMATION FOR SEQ ID NO: 1: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 3014 base pairs 
; TYPE: nucleic acid 

STRANDEDNESS: double 
TOPOLOGY: linear 
MOLECULE TYPE: cDNA 

SEQUENCE DESCRIPTION: SEQ ID NO: 1: 
US-10-256-702-1 



Query Match 83.5%; Score 2252.2; DB 14; Length 3014; 

Best Local Similarity 89.7%; Pred. No. 0; 

Matches 2419; Conservative 0; Mismatches 278; Indels 0; Gaps 0; 

Qy 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGTGCTCCTGGGCATAGTCCTCGCCGCCTGGCTT 60 

Qy 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

II II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 CGTGGTTCGGGTGCCCAGCAGAGTGCCACGGTGGCCAATCCAGTGCCCGGTGCCAACCCC 120 



Qy 121 GAC CT GCTTCC C C ACTT CCT GGT GGAGCCCGAGGAT GT GT AC AT C GT CAAGAACAAGC CA 180 

II II I II I Mill I II I II I II I I I I I Mill Ml I M I I I I I II I I I I I I I I I 
Db 121 GACCT GCT GC C C CACTT C CT GGT AGAGCCT GAGGACGT GT ACATT GT CAAGAACAAGCCG 180 



Qy 181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I 

Db 181 GTGTTGTTGGTGTGCAAGGCTGTGCCTGCCACCCAGATCTTCTTCAAGTGCAATGGGGAA 24 0 

Qy 241 T GGGT GCGC CAGGT GGAC CACGT GATC GAGCGC AGCAC AGACGGGAGCAGT GGGCT GCCC 300 

I I I II I I I I I I I I II I I I I I II II I I I I I I I I III I I I I I I II I I I I 

Db 241 T GGGT CCGCCAGGT CGAT C AC GTAATT GAAC GC AGCAC CGAC AGCAGCAGCGGATT GCCA 300 

Qy 301 ACCAT GGAGGT C CGCATTAAT GT CT CAAGGC AGCAGGTCGAGAAGGT GTT CGGGCTGGAG 360 

I I I I I I I I I II I I I II II II II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 301 AC CAT GGAGGT CCGT AT CAAC GT AT CGAGGC AGCAGGT AGAGAAAGT GTTT GGGCT GGAG 360 

Qy 361 GAAT ACT GGT GCCAGTGC GT GGC AT GGAGCT CCT CGGGCAC CAC CAAGAGT CAGAAGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 361 GAAT ACT GGT GCCAGTGT GT GGC AT GGAGCT CCT C GGGT AC CAC CAAAAGT CAGAAGGCC 420 

Qy 421 T ACAT CC GCAT AGCC AGATT GCGCAAGAACTT C GAGCAGGAGCC GCT GGCCAAGGAGGTG 480 

I I I I I I I I II III I I I I II I I I I II I I I I I I I I I I I I I I I I I I II I I I I III 

Db 421 T ACAT CCGGATTGCCTAT TT GCGCAAGAACTT T GAGCAGGAGCCACT GGCCAAGGAAGTG 480 

Qy 481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

II I I II I I I I I I I I I II II II II II II II II II I I I I I I I I I I III 

Db 481 T CACT GGAGCAAGGCAT T GT ACT AC CT T GT C GC C C CC CAGAAGGAAT CC CCCCAGCT GAG 540 

Qy 541 GT GGAGT GGCT CC GGAAC GAGGAC CTGGT GGAC C C GT CCCT GGAC C CCAAT GT AT AC AT C 600 

I I I I I II I I I I II II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 541 GT GGAGT GGCTT C GAAAT GAGGAC CT CGT GGAC C CCT CCCT CGAT C CCAAT GT GT ACATC 600 

Qy 601 ACGCGGGAGCACAGC CT GGT GGT GCGACAGGC C C GCCTTGCTGACAC GGCCAACTACACC 660 

I I I I I I I I II I I I I I I I II I II I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I 

Db 601 ACGCGGGAGCACAGCCTAGTCGTGCGTCAGGCCCGCCTGGCCGACACGGCCAACTACACC 660 

Qy 661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

II II I I I I I I I I I I I I I I I II I I I I I I I I III I I I I II II I I I I I II II 

Db 661 TGTGTGGCCAAGAACATCGTAGCCCGTCGCCGAAGCACCTCTGCAGCGGTCATTGTTTAT 720 

Qy 721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 GTGAACGGTGGGTGGTCGACGTGGACTGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGT 780 

Qy 781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 840 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I III 

Db 781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCACCTCTCAACGGGGGCGCCTTC 840 

Qy 841 T GTGAGGGGC AGAAT GT CCAGAAAACAGCCT GCGC CACCCT GT GC CCAGT AGAC GGC AGC 900 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II III 

Db 841 TGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACTCTGTGCCCAGTGGATGGGAGC 900 

Qy 901 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 960 

I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 TGGAGTTCGTGGAGTAAGTGGTCAGCCTGTGGGCTTGACTGCACCCACTGGCGGAGCCGC 960 



Qy 

Db 



961 GAGT GCT CTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCT GGAC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I 
961 GAGT GCT CT GACCC AGCACC CC GCAAT GGAGGT GAGGAGT GT C GGGGT GCT GACCT GGAC 1020 



Qy 1021 ACC CGCAACTGT AC CAGT GACCT CT GT GT ACACAGTGCTT CT GGCCCT GAGGAC GT GGC C 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 ACCCGCAACTGTACCAGTGACCTCTGCCTGCACACCGCTTCTTGCCCCGAGGACGTGGCT 1080 

Qy 1081 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1140 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 CTCTACATCGGCCTTGTCGCTGTGGCTGTGTGCCTCTTCTTGCTGTTGCTGGCCCTTGGA 114 0 

Qy 1141 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1200 

III I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 1141 CT CAT TT ACTGT CGCAAGAAGGAAGGGCT GGACT C CGAT GTGGCC GACT C GT C CAT CCT C 1200 

Qy 1201 AC CTCAGGCTT CCAGCCCGT CAGC AT CAAGC CCAGCAAAGCAGACAAC C C C CAT CT GCT C 1260 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I 

Db 1201 ACCTCGGGCTTCCAGCCTGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCACCTGCTC 1260 

Qy 1261 AC CAT C CAGCC GGAC CT CAGCACC AC CACC ACCACCT AC CAGGGCAGT CT CT GT C C CCGG 1320 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I || 

Db 1261 AC CAT C CAGCCAGACCT CAGCAC CACCACT ACC ACCT AC CAGGGCAGT CT AT GT T CGAGG 1320 

Qy 1321 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 CAGGAT GGACC CAGC CC CAAGTT CCAGCT CT CTAAT GGT CAC CT GCTCAGCC C ACT GGGG 1380 

Qy 1381 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 1440 

I I II I I I I I II I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 1381 AGTGGCCGCCATACGTTGCACCACAGCTCACCCACCTCTGAGGCTGAGGACTTCGTCTCC 1440 

Qy 1441 CGCCT CTC CAC C CAGAACT ACTT C CGCT CC CT GC CC CGAGGCAC CAGCAACAT GACCT AT 1500 

I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1441 CGCCTCTCCACCCAAAACTACTTTCGTTCCCTGCCCCGCGGCACCAGCAACATGGCCTAC 1500 

Qy 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACGGGGATCAGCCTCCTC 1560 

Qy 1561 AT CCCCCCAGAT GCCAT ACCCCGAGGGAAGATCTAT GAGATCTACCTCACGCTGCACAAG 1620 

II I I I I I I II I I I I I I I I I I I I I MINIM I I I I I I I I I I I I I I I II I I I I I I 

Db 1561 AT ACC CCCGGAT GC CAT CC CCC GAGGAAAGAT CT ACGAGATCT AC CT CACACT GC ACAAG 1620 

Qy 1621 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1680 

II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I 

Db 1621 CCAGAAGACGT GAGGTT GCCCCT AGCT GGCT GT CAGACC CT GCT GAGT C C AGT CGTTAGC 1680 

Qy 1681 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 174 0 

Mill Mill II I I I II I II I I I I I I I II I I II I I I II II Ml I I M I II II II 

Db 1681 TGTGGGCCCCCAGGAGTCCTGCTCACCCGGCCAGTCATCCTTGCAATGGACCACTGTGGA 1740 

Qy 1741 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1800 

I I I I M II I I I I II I II I II II I I I I I I I II I I I I II I I I I I I I I I I I I II I I I III 

Db 1741 GAGCCCAGCCCTGACAGCTGGAGTCTGCGCCTCAAAAAGCAGTCCTGCGAGGGCAGTTGG 1800 

Qy 1801 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1860 

I I I I I II I I I II I I I II II II I I I I I M II I I I I I I I I I I I I I I I I I I I II I I II 

Db 1801 GAGGATGT GCT GC ACCT T GGT GAGGAGTCACCTTCCCACCTCT ACT ACT GCC AGCT GGAG 1860 

Qy 1861 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1920 



Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1861 GCCGGGGCCTGCTATGTCTTCACGGAGCAGCTGGGCCGCTTTGCCCTGGTAGGAGAGGCC 1920 

1921 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 1980 

I I I I I I I II I I i I I I I I I I I I I I I I I I III I I I I I I I I I I I II I I I I I I I I II 
1921 CTCAGCGTGGCTGCCACCAAGCGCCTCAGGCTCCTTCTGTTTGCTCCCGTGGCCTGTACG 1980 

1981 T CCCTCGAGTACAACATCCGGGTCTACTGCCTGCAT GACACCCACGATGCACT CAAGGAG 2040 

I I I I I I I I I I I I I I I I I I I II I I II I I I I II I I I I I I II I I I II I I I I I I I I I 
1981 T CCCTTGAGT ACAAC AT CCGAGT GTACT GC CT AC ACGACACCCACGAC GCT CT CAAGGAG 204 0 

2041 GT GGT GC AGCT GGAGAAGCAGCT GGGGGGACAGCT GAT CCAGGAGC C ACGGGT CCT GCAC 2100 

I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I II I I I I I I 
2041 GT GGT GCAGCT GGAGAAGCAGCT AGGT GGACAGCT GAT CCAGGAGCCT CGC GT C CT GCAC 2100 

2101 T T CAAGGACAGTT AC C ACAAC CTGCGCCTAT CCAT CCAC GAT GT GC CCAGCT CCCT GT GG 2160 

I I I I I I I I I I I I I I I I I I II I I II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2101 TT CAAAGACAGTTAC CACAACCT AC GT CT CT CCAT CCAC GACGT GC C C AGCTC CCT GT GG 2160 

2161 AAGAGTAAGCT C CTT GT CAGCTACCAGGAGAT C C CCTT TTAT CACAT CT GGAAT GGCACG 2220 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2161 AAGAGCAAGCT ACT T GT CAGCTACCAGGAGAT C CCTTTTT AC CACAT CTGGAAC GGC ACC 2220 

2221 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2280 

I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I 
2221 CAGCAGT AT CT GCACTGCAC CTT CACC CT GGAGC GCAT CAACGC CAGC AC C AGCGACCT G 2280 

2281 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I 
2281 GCCTGCAAGGT GTGGGTGTGGCAGGTGGAGGGAGATGGGCAGAGCTT CAACAT CAACTTC 2340 

2341 AACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTC 2400 

I I I I I I II I I I I I I I I II I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I 
2341 AACATCACTAAGGACACAAGGTTTGCTGAATTGTTGGCTCTGGAGAGTGAAGGGGGGGTC 24 00 

2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II 
2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTT CCT CATTCGGCAAAAGAT CATC 2460 

2461 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2520 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I || I I I | I | | | I 
2461 GC CAGTCT GGACC CACC CTGCAGCCGGGGC GC C GACT GGAGAACT CT AGC C CAGAAACTT 2520 

2521 CACCT GGACAGCCAT CT CAGCT T CTTT GCCT C CAAGC CCAGCC C CAC AGC CAT GAT CCT C 2580 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I II I I I I I II I I I I I 
2521 CACCT GGACAGCCAT CTTAGCTT CTTT GCCT CCAAGCCCAGCCCTACAGCCATGAT.CCTC 2580 

2581 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 264 0 

I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III' 
2581 AACCTATGGGAGGCACGGCACTTCCCCAACGGCAACCTCGGCCAGCTGGCAGCAGCTGTG 2640 

2641 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2697 

II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
2641 GCCGGACTGGGCCAACCAGATGCTGGCCTCTTCACGGTGTCGGAGGCCGAGTGTTGA 2697 



RESULT 
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STREET: 268 BUSH STREET, SUITE 3200 
CITY: SAN FRANCISCO 
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ZIP: 94104 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC- DOS/MS-DOS 
; SOFTWARE: Patentln Release #1.0, Version #1.30 

CURRENT APPLICATION DATA: 
; APPLICATION NUMBER: US/09/933,261 

; FILING DATE: 20-Aug-2001 

CLASSIFICATION: <Unknown> 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 08/808,982 
; FILING DATE: <Unknown> 

ATTORNEY/AGENT INFORMATION: 
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REGISTRATION NUMBER: 36,627 
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LENGTH: 1787 base pairs 
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SEQUENCE DESCRIPTION: SEQ ID NO: 2: 
US-09-933-261-2 

Query Match 57.6%; Score 1552.4; DB 10; Length 1787; 

Best Local Similarity 98.5%; Pred. No. 0; 

Matches 1651; Conservative 0; Mismatches 16; Indels 9; Gaps 8; 

Qy 1025 GCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCT 1084 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 GCAACTGTACCAGTGACCTCTG-GTACACACTGCTTCTGGCCCTGAGGACGTGGCCCTCT 59 

Qy 1085 ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 1144 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



60 ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 119 

1145 TTT ATT GCCGGAAGAAGGAGGGGCT GGACTCAGAT GT GGCT GACT C GT CCATT CT CACCT 1204 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I 

T TT ATT GCCGGAAGAAGGAGGGGCT GGACTCAGAT GT GGCT GACT CGT C CATTCT CACCT 



120 



1205 CAGGCT T CC AGCCCGT CAGCAT C - AAGC CCAGCAAAGC AGACAAC CCC CAT CTGCT CAC C 
I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
CAGGCTT CCAGCC CGT CAGCAT CTAAGC CCAGCAAAGC AGACAACCCC CAT CT GCT CAC C 



180 



1264 



240 



1324 



300 



AT C C AGC CGGACCT CAGCACCACCACCACC AC CT ACCAGGGCAGT CT CT GT CCCCGGCAG 
I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AT CCAGCC GGACCT CAGCAC CAC CACCAC CACCT AC CAG GGCAGT CTCT GTC CCCGGCAG 

GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 



179 



1263 



239 



1323 



299 



1383 



359 



1384 GGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGC 1443 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGCCGC CACACACT GCACCACAGCT CT C C CACCT CT GAGGCC GAGGAGTT C GT CT C C CGC 



360 



419 



1444 CTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGG 1503 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I 
CT CT C CAC C CAGAACT ACTT C C GCT CC CT GC C CC GAGGCACCAGCAACAT GAC CT AT GGG 



420 



1504 ACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATC 
I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTCCTCATC 



480 



1564 



540 



C C C CCAGAT GC CATAC C C C GAGGGAAGAT CT AT GAGAT CT AC CTC ACGCT GCACAAGCC G 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CC CCCAGAT GCCAT AC CC CGAGGGAAGAT CT AT GAGAT CT AC CTC ACGCT GCACAAGCCG 



1624 GAAGACGT GAGGTT GC C C CT AGCT GGCT GT C AGACC CT GCT GAGT CCCAT C GTT AGCTGT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

600 GAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGT 



479 



1563 



539 



1623 



599 



1683 



659 



1684 GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 1743 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 



660 



719 



1744 CCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAG 1803 
I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II 
CCCAGCCCTGACAGCTGGAGCCTGGCCCTCAAAAAGCAGTCGTGCGAGGG-AGCTGGGAG 



720 



778 



1804 GATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCC 1863 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

779 GATGT-CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCC 837 

1864 AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 1923 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

838 AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 897 

1924 AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 1983 
I I I I I I I I II I II I I I I III III III II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

898 AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 957 



Qy 1984 CT CGAGTACAACAT CC GGGT CT ACT GC CTGCAT GACAC CCACGAT GCACT CAAGGAGGT G 2043 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 958 CT CGAGTACAACAT C CGGGT CT ACT GC CT GCAT GACAC CCACGAT GCACT CAAGGAGGT G 1017 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 



2044 GT GC AGCT GGAGAAGCAGCT GGGGGGACAGCTGAT CCAGGAGCCACGGGT CCTGCACTT C 2103 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1018 GT GCAGCT GGAGAAGCAGCT GGGGGGACAGCT GAT C CAGGAGCCAC GGGT C CT GC ACTT - 1076 

2104 AAGGACAGTT AC CACAACCT GC GCCT AT CCATCCAC GATGT GCC CAGCTC CCT GT GGAAG 2163 

I I I I I I I II I I I I I I I I I I I III II I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

1077 AAGGACAGTT AC CACAACCT — GCC CTATCAT CCAC GATGT GCCCAGCTC CCT GT GGAAG 1134 

2164 AGTAAGCT C CTT GT CAGCT AC C AGGAGATCCCCTTTT ATCACAT CTGGAAT GGC ACGCAG 2223 

I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGTAAGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAG 1194 



1135 



2224 



2283 



CGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCC 

I II I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1195 CGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCC 1254 

2284 TGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAAC 2343 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1255 T GCAAGCT GT GGGT GTGGCAGGT GGAGGGC GACGGGCAGAGCTT CAGCAT CAACT T CAAC 1314 

2344 AT CAC CAAGGACACAAGGTTT GCT GAGCTGCT GGCT CT GGAGAGT GAAGCGGGGGT CCCA 2403 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1315 AT CAC CAAGGACACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GAAGCGGGGGT CCCA 1374 

2404 GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCC 2463 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCC 1434 



1375 



2523 



2464 AGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
1435 AGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 1494 

2524 CT GGACAGC C AT CT CAGCTT CTT T GCCT CCAAGCC CAGCC C CACAGC CAT GAT C CT CAAC 2583 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

14 95 CT GGACAGCC AT CT CAGCTT CTT T GC CT CCAAGCCCAGCC C CACAGC CAT GAT C CT CAAC 1554 

2584 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 2643 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1555 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 1614 

2644 GGACTGGGCCAGCCAGACGCTGGCCTC-TTCACAGTG-TCGGAGGCTGAGTGCTGA 2697 

II II I I I II MM I I I I II I I I I I II I I I I I I I I I I I I I I I II II I 
1615 GGGACTGGCCAGCAGGACGGTGGCTTCTTTCACAGTGTTCGGAGGCTGAGTGCTGA 1670 



RESULT 10 
US-10-256-702-2 

; Sequence 2, Application US/10256702 
; Publication No. US20030059859A1 

GENERAL INFORMATION: 
; APPLICANT: Tessier-Lavigne, Marc 

; Leonardo, E . David 



; Hink, Lindsay 

; Masu, Masayuki 

; Kazuko, Keino-Masu 

TITLE OF INVENTION: Netrin Receptors 
; NUMBER OF SEQUENCES: 8 

CORRESPONDENCE ADDRESS: 

ADDRESSEE: SCIENCE & TECHNOLOGY LAW GROUP 

STREET: 268 BUSH STREET, SUITE 3200 

CITY: SAN FRANCISCO 

STATE: CALIFORNIA 

COUNTRY: USA 

ZIP: 94104 
; COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 

COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patent In Release #1.0, Version #1.30 
; CURRENT APPLICATION DATA: 

; APPLICATION NUMBER: US/ 10/256, 702 

FILING DATE: 27-Sep-2002, 

CLASSIFICATION: <Unknown> 
; PRIOR APPLICATION DATA: 

; APPLICATION NUMBER: US/09/933,261 

FILING DATE: 20-Aug-2001 

APPLICATION NUMBER: 08/808,982 

FILING DATE: <Unknown> 
ATTORNEY/AGENT INFORMATION: 

NAME: OSMAN, RICHARD A 
; REGISTRATION NUMBER: 36,627 

; REFERENCE/ DOCKET NUMBER: UC96-217 

; TELECOMMUNICATION INFORMATION: 

TELEPHONE: (415) 343-4341 

TELEFAX: (415) 343-4342 
; INFORMATION FOR SEQ ID NO: 2: 
; SEQUENCE CHARACTERISTICS: 

LENGTH: 1787 base pairs 
; TYPE: nucleic acid 

; STRANDEDNESS : double 

; TOPOLOGY: linear 

; MOLECULE TYPE: cDNA 

SEQUENCE DESCRIPTION: SEQ ID NO: 2: 
US-10-256-702-2 

Query Match 57.6%; Score 1552.4; DB 14; Length 1787; 

Best Local Similarity 98.5%; Pred. No. 0; 

Matches 1651; Conservative 0; Mismatches 16; Indels 9; Gaps 8; 

Qy 1025 GCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCT 1084 

I I I I I I II II I I II I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I 
Db 1 GCAACTGTACCAGTGACCTCTG-GTACACACTGCTTCTGGCCCTGAGGACGTGGCCCTCT 59 

Qy 1085 ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 1144 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 60 ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 119 

Qy 1145 TTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCT 1204 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 



120 TTT ATTGCC GGAAGAAGGAGGGGCT GGACT CAGATGT GGCT GACT CGT CCATT CT CACCT 179 



1205 CAGGCTT CCAGCCCGTCAGCAT C - AAGCCCAGCAAAGCAGACAAC CC CCAT CT GCTCACC 

I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I 
180 CAGGCTT CCAGCCCGTCAGCAT CTAAGCCCAGCAAAGCAGACAACCC C CAT CT GCT CAC C 

1264 AT CCAGC C GGACCT C AGCAC CAC CAC CACCACCT ACC AGGGCAGT CT CTGT CCC CGGCAG 
I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
240 AT CCAGC C GGAC CT C AGCAC CAC CAC CAC CAC CT ACC AGGGCAGT CT CT GT CCCC GGCAG 

1324 GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
300 GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 



1263 



239 



1323 



299 



1383 



359 



1384 GGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGC 1443 
I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGC 



360 



1444 CTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGG 



420 



1504 ACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AC CT T CAACTT CCT CGGGGGC CGGCTGATGAT C C CTAATACAGGAAT C AGC CT C CT CATC 



480 



1564 



540 



1624 



600 



C C CCCAGAT GC CAT AC C C CGAGGGAAGATCT AT GAGAT CT ACCT CAC GCT GCACAAGCCG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCCCCAGATGCCATACCCCGAGGGAAGATCTATGAGATCTACCTCACGCTGCACAAGCCG 



419 



1503 



479 



1563 



539 



1623 



599 



GAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGT 1683 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGT 659 



1684 GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 1743 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 



660 



719 



174 4 CCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAG 1803 
I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I 
720 CCCAGCCCTGACAGCTGGAGCCTGGCCCTCAAAAAGCAGTCGTGCGAGGG-AGCTGGGAG 778 



1804 GATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
779 GATGT-CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCC 

1864 AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 



838 



1924 



898 



1984 



958 



1863 



837 



1923 



897 



AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 1983 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 957 

CT CGAGT ACAAC AT CCGGGT CT ACT GCCTGC AT GACAC CC ACGAT GC ACT CAAGGAGGT G 2043 

I I I I I I III III I I II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

CT CGAGT ACAAC AT C C GGGT CT ACT GCCTGCAT GACAC CC AC GAT GCACT CAAGGAGGT G 1017 



Qy 2044 GTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTC 2103 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I 
Db 1018 GTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTT- 1076 

Qy 2104 AAGGACAGT T AC CACAACCTGC GC CT AT C C ATC CAC GAT GT GCCCAGCT C CCT GT GGAAG 2163 

I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1077 AAGGACAGTT ACC ACAACCT — GCCCT AT CAT CCACGAT GT GCC CAGCT CCCT GT GGAAG 1134 

Qy 2164 AGTAAGCTCCTT GTCAGCT AC CAGGAGAT CCCCTTTT AT CAC AT CTGGAAT GGCAC GCAG 2223 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I 
Db 1135 AGTAAGCTC CTT GTCAGCT AC CAGGAGAT C CC CT TTTAT CACAT CTGGAAT GGCACGC AG 1194 

Qy 2224 CGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCC 2283 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1195 CGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCC 1254 

Qy 2284 TGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAAC 2343 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1255 T GCAAGCTGT GGGTGT GGCAGGT GGAGGGCGAC GGGCAGAGCTT CAGCAT CAACTTCAAC 1314 

Qy 2344 AT CACCAAGGACACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GAAGCGGGGGT CC CA 2403 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1315 ATC ACCAAGGACACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GAAGC GGGGGT C CCA 1374 

Qy 2404 GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCC 2463 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I IJ 
Db 1375 GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCC 1434 

Qy 2464 AGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 2523 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1435 AGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 1494 

Qy 2524 CTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAAC 2583 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1495 CTGGACAGC CAT CT CAGCTT CTTT GC CT C CAAGCCCAGC CC CACAGCCAT GAT CCT CAAC 1554 

Qy 2584 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 2643 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1555 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 1614 

Qy 2644 GGACTGGGCCAGCCAGACGCTGGCCTC-TTCACAGTG-TCGGAGGCTGAGTGCTGA 2697 

II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1615 GGGACTGGCCAGCAGGACGGT GGCT T CTT TCACAGTGTTCGGAGGCTGAGT GCT GA 1670 



RESULT 11 
US-10-296-115-365 

; Sequence 365, Application US/10296115 
; Publication No. US2004 0053248A1 
; GENERAL INFORMATION: 
; APPLICANT: Hyseq Inc 

; TITLE OF INVENTION: No. US20040053248Alel Nucleic Acids and Polypeptides 
; FILE REFERENCE: 784PCT 

; CURRENT APPLICATION NUMBER: US/10/296, 115 

; CURRENT FILING DATE: 2002-11-18 

; PRIOR APPLICATION NUMBER: US09/488,725 



; PRIOR FILING DATE: 2000-01-21 

; PRIOR APPLICATION NUMBER: US09/552 / 317 

; PRIOR FILING DATE: 2000-04-25 

; NUMBER OF SEQ ID NOS : 1478 

; SEQ ID NO 365 

LENGTH: 1321 

TYPE: DNA 

ORGANISM: Homo sapiens 
US-10-296-115-365 

Query Match 44.5%; Score 1200.6; DB 17; Length 1321; 

Best Local Similarity 98.0%; Pred. No. 8.1e-301; 

Matches 1289; Conservative 0; Mismatches 19; Indels 7; Gaps 7; 

Qy 1390 C AC ACACTGCACCACAGCT CT CC C ACCT CT GAGGCC GAGGAGTT CGTCT CC CGCCT CT C C 1449 

I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 CACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCC 60 

Qy 1450 ACC C AGAACT ACTT CCGCTCCCT GC CC C GAGGCACCAGCAACAT GACCT AT GGGACCTTC 1509 

I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 ACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTC 120 

Qy 1510 T^ACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCA 1569 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 AACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTCCTCATCCCCCCA 180 

Qy 1570 GAT GC CAT AC C C C GAGGGAAGAT CT AT GAGAT CT ACCT CAC GCT GCACAAGCCGGAAGAC 1629 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 GATGCCATACCCCGAGGGAAGAT CTATGAGATCTACCT CACGCT GCACAAGCCGGAAGAC 240 

Qy 1630 GTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCC 1689 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 GTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCC 300 

Qy 1690 CCT-GGCGTCCTGCTCACCCGGCCAGTCATCCT-GGCTATGGACCACTGT-GGGGAGCCC 1746 

III I I I I I I I I I I I I I I I I I I I II I I I I I II II I I I I I I I I I I I I I I I I I I I I I I 
Db 301 CCTGGGCGTCCTGCTTACCCGGCCAGTCATCCTGGGGTATGGACCACTGTGGGGGAGCCC 360 

Qy 1747 AGCCCTGACAGCT-GGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGA 1805 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 AGCCCTGACAGCTGGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGA 420 

Qy 1806 TGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAG 1865 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 TGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAG 480 

Qy 1866 TGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAG 1925 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I II I I I I 
Db 481 TGCCTGCTACGTCTTCACCGAGCAGCTGAGCCGCTATGCCCTGGTGGGAGAGGCCCTCAG 540 

Qy 1926 CGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCT 1985 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db ' 541 CGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCT 600 • 

Qy 1986 CGAGT ACAAC ATCCGG GT CT ACT GC CT GCAT GAC ACCCACGAT GC ACT CAAGGAGGT GGT 2045 

II III I I I I I I I I III III II I I Ml III I I III I I III I I II II Mil II I II 

Db 601 CGAGT ACAAC AT ACT GGT CT ACT GC CT GCAT GAC ACT CAC GAT GC ACT CAAC GT AGT GGT 660 



Qy 

Db 



2046 GC AGCTGGAGAAGC AGCT GGGGGGACAGCT GAT CCAGGAGCCACGGGT C CT GC ACTT CAA 2105 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I III I I I I I I I I I I I 
661 GCAGCTGGAGAAGCAGCTGCAGGGACAGCTGATCCAGGAGCCACTGGTACTGCACTTCAA 720 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 



2106 GGACAGTT AC CACAAC CT GCGC CT AT CC AT CCACGAT GTGC CCAGCTCCCT GT GGAAGAG 2165 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

721 GGACAGTT AC CACAACCT GCGC CT AT C CAT C CACGAT GTGCCCAGCT CC CT GTGGAAGAG 780 

2166 TAAGCT C CTT GT CAGCT ACCAGGAGAT CCCCTT TT AT CACAT CT GGAAT GGCACGC AGCG 2225 

I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

781 TAAGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCG 840 

2226 GTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTG 2285 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

841 GTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTG 900 

2286 CAAGCTGT GGGTGT GGCAGGT GGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACAT 2345 
I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

901 CAAGCTGTGGGTGT GGCAGGT GGAGGGCGACGGGCAGAGCTTCAGCATCAACTT CAACAT 960 

2346 CAC CAAGGACACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GAAGCGGGGGT CCC AGC 2405 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

961 CAC CAAGGACACAAGGT TTGCT GAGCT GCT GGCT CT GGAGAGT GAAGC GGGGGT C CCAGC 1020 

2406 CCTGGT GGGCC C CAGT GCCT T CAAGAT CCCCTT C CT CATT C GGCAGAAGATAATTT C CAG 2465 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1021 CCTGGTGGGC C CCAGT GC CT T CAAGAT CCCCT T C CT CATT C GGCAGAAGATAAT TT CCAG 1080 

2466 CCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCT 2525 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I II I I I I I I I II I I I I I I I I II I I I I I 

1081 CCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCT 1140 

2526 G GACAGCCAT CT CAGCT T CTTT GC CT C CAAGCCCAGCCCCACAGC CAT GAT CCT CAAC CT 2585 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1141 GGACAGCCAT CT CAGCTT CTTT GCCT C CAAGC C CAGC CCCAC AGC CAT GAT CCT CAAC CT 1200 

2586 GTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT-G 2644 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1201 GTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGG 1260 



2645 



2697 



GACTGGGCCAGCCAGACGCTGGCCTC-TTCACAGTG-TCGGAGGCTGAGTGCTGA 
I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I II 
1261 GACTGGGCCAGCAGGACGGTGGCTTCTTTCACAGTGTTCGGAGGCTGAGTGCTGA 1315 
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Sequence 1, Application US/10087684 
Publication No. US20040029116A1 
GENERAL INFORMATION: 
APPLICANT: Edinger, Shlomit R. 
APPLICANT: MacDougall, John R. 
APPLICANT: Millet, Isabelle 
APPLICANT: Ellerman, Karen 
APPLICANT: Stone, David J. 
APPLICANT: Grosse, William M. 



APPLICANT: Lepley, Denise M. 
APPLICANT: Rieger, Daniel K.. 
APPLICANT: Burgess, Cathereine E. 
APPLICANT: Casman, Stacie, J. 
APPLICANT: Spytek, Kimberly A. 
APPLICANT: Boldog, Ferenc L. 
APPLICANT: Li, Li 
APPLICANT: Padigaru, Muralidhara 
APPLICANT: Mishra, Vishnu 
APPLICANT: Shenoy, Suresh G. 
APPLICANT: Rastelli, Luca 
APPLICANT: Tchernev, Velizar T. 
APPLICANT: Vernet, Corine A.M. 
APPLICANT: Zerhusen, Bryan D. 
APPLICANT: Malyankar, Uriel M. 
APPLICANT: Guo, Xiaojia 
APPLICANT: Miller, Charles E. 
APPLICANT: Gangolli, Esha A. 

TITLE OF INVENTION: PROTEINS AND NUCLEIC ACIDS ENCODING SAME 
FILE REFERENCE: 21402-214 CIP 
CURRENT APPLICATION NUMBER: US/10/087,684 
CURRENT FILING DATE: 2003-03-10 
PRIOR APPLICATION NUMBER: 60/253,834 
PRIOR FILING DATE: 2000-11-29 
PRIOR APPLICATION NUMBER: 60/250,926 
PRIOR FILING DATE: 2000-11-30 
PRIOR APPLICATION NUMBER: 60/264,180 
PRIOR FILING DATE: 2001-01-25 
PRIOR APPLICATION NUMBER: 60/274,194 
PRIOR FILING DATE: 2001-03-08 
PRIOR APPLICATION NUMBER: 60/313,656 
PRIOR FILING DATE: 2001-08-20 
PRIOR APPLICATION NUMBER: 60/327,456 
PRIOR FILING DATE: 2001-10-05 
NUMBER OF SEQ ID NOS : 220 
SOFTWARE: CuraSeqList version 0.1 
SEQ ID NO 1 
LENGTH: 2860 
TYPE: DNA 

ORGANISM: Homo sapiens 
FEATURE: 
NAME/ KEY: CDS 
LOCATION: (59) . . (2857) 
US-10-087-684-1 



Query Match 34.7%; 
Best Local Similarity 61.7%; 
Matches 1662; Conservative 



Score 936.2; DB 17; Length 2860; 
Pred. No. 2.8e-232; 
0; Mismatches 938; Indels 93; 



Gaps 



7; 



Qy 

Db 



98 ACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATG 157 
III III II I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

168 ACT CCTTCC CGT CAGC GCCAGCAGAGCC GCT GC C CT ACT T CCT GC AGGAGC CACAGGAC G 227 



Qy 

Db 



158 TGTACATCGTCAAGAACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGA 217 

I I I I I I I I I I II I I I I I I I I I III III I I I I I I I I I I I I I I I I 

228 CCT ACATT GT GAAGAACAAGCCT GT GGAGCT CC GCT GCC GCGCCTT C C C C GC CAC AC AGA 287 



Qy 218 TCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCA 277 

II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II II 

Db 288 TCTACTTCAAGTGCAACGGCGAGTGGGTCAGCCAGAACGACCACGTCACACAGGAAGGCC 347 

Qy 278 CAGACGGGAGC AGT GGGCTGC CCACCAT GGAGGT CCGC AT TAAT GT CT CAAGGCAGCAGG 337 

I I 1 I II I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 348 TGGATGAGGCCACCGGTCTGCGGGTGCGCGAGGTGCAGATCGAGGTGTCGCGGCAGCAGG 407 

Qy 338 TCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGG 397. 

I III II I II I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I III 

Db 408 TGGAGGAGCTCTTTGGGCTGGAGGATTACTGGTGCCAGTGCGTGGCCTGGAGCTCCGCGG 467 

Qy 398 GCACCACCAAGAGT CAGAAGGCCTACAT CC GCAT AGC CAGATT GCGCAAGAACTT CGAGC 457 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 468 GCACCACCAAGAGT CGC C GAGCCT AC GT C CGCAT CGC CT ACCT GCGCAAGAACT T C GAT C 527 

Qy 458 AGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCAC 517 

I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I 

Db 528 AGGAGCCTCTGGGCAAGGAGGTGCCCCTGGACCATGAGGTTCTCCTGCAGTGCCGCCCGC 587 

Qy 518 CGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGT 577 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 588 CGGAGGGGGT GC CT GT GGCCGAGGT GGAAT GGCT CAAGAAT GAGGAT GT CAT C GACCC CA 647 

Qy 578 CC CT GGACC CCAAT GT AT ACAT CAC GCGGGAGCACAGCCT GGT GGT GCGACAGGC CCGCC 637 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I. 

Db 648 CCCAGGACACCAACTTCCTGCTCACCATCGACCACAACCTCATCATCCGCCAGGCCCGCC 707 

Qy 638 TT GCT GACACGGC CAACTACACCTGCGT GGC CAAGAACAT CGT GGCACGT CGCCGCAGCG 697 

I I II I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 708 T GT C GGACACT GC CAACT AT AC CT GC GT GGC CAAGAACAT CGT GGCCAAAC GC CGGAGCA 767 

Qy 698 CCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCG 757 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7 68 CCACT GC CAC C GT CAT CGT CTAC GT GAATGGCGGCT GGT CC AGCT GGGC AGAGT GGT CAC 827 

Qy 758 TCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGG 817 

I I I I I I I I I I I I I II I I I I I I I I II I II I I I I I I II I I I I I I I I I I I 

Db 828 CCTGCTCCAACCGCTGTGGCCGAGGCTGGCAGAAGCGCACCCGGACCTGCACCAACCCCG 887 

Qy 818 CGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCA 877 

I II I I I I I I I I II II I I I I I II I I I III I I I I I I I II I I I I I I III 

Db 888 CT C CACTCAAC GGAGGGGCCT T CT GCGAGGGCCAGGCATT CCAGAAGAC C GCCT GCACCA 947 

Qy 878 CCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGG 937 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 948 CCAT CT GC C CAGT C GAT GGGGC GT GGACGGAGT GGAGCAAGT GGT CAGC CT GC AGCACT G 1007 

Qy 938 ACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGG 997 

III I I I I I I I I II I I I II I II I I I I II I I I I I I I I I I I I I I I 

Db 1008 AGTGTGCCCACTGGCGTAGCCGCGAGTGCATGGCGCCCCCACCCCAGAACGGAGGCCGTG 1067 

Qy 998 AGT GCCAGGGCACT GACCT GGACACCCGCAACT GTACCAGTGACCTCTGTGT ACACAGTG 1057 

I I I I I I I I I I I I I I I I I II I I II I I I I III I 

Db 1068 ACT GCAGCGGGACGCT GCT CGACTCTAAGAACTGCACAGATGGGCTGT GCAT GCAACTGG 1127 

Qy 1058 CTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGG 1117 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



I II I II I I I l I 1 1 1 I III l 1 1 1 

.1128 AGGCCTCAGGGGATGCGGCGCTGTATGCGGGGCTCGTGGTGGCCATCTTCGTGGTCGTGG 1187 

1118 TCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAG 1177 

III II II I I I I II I I I I I I I I I II I I I 

1188 CAATCCTCATGGCGGTGGGGGTGGTGGTGTACCGCCGCAACTGCCGTGACTTCGACACAG 1247 

1178 ATGTGGCTGACTCGTCCATT CT CAC CT CAGGCTT CC AGCC C GT C AGC ATCAAGC CCA 1234 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1248 AC AT CACT GACT CAT CT GCT GCCCT GACT GGTGGTTT C CACCC CGT CAACTTTAAGAC GG 1307 

1235 GCAAAGC AGACAACC CCCAT CT GCT CACCATCCAGCCGGACCTCAGCACCACCA 1288 

I I I I I I I I I I I I I II II I I I I I I I I I I I I 

1308 CAAGGCCCAGTAACCCGCAGCTCCTACACCCCTCTGTGCCTCCTGACCTGACAGCCAGCG 1367 

1289 CC AC CACCT AC CAGGGC AGT CT CT GT CC CC GGCAGGA 1325 

II I I I I I I I II I I I I I I I I I I II 

1368 C CGGCAT CT AC C GC GGACCC GT GT AT GC CCT GCAGGACT C CAC C GACAAAATCC CCAT GA 1427 

132 6 T GGGC C CAGCC C CAAGTT C CAGCT CACCA 1354 

I I I I I I I I I I I I I I I I II 
1428 CCAACT CT CCT CT GCTGGACC C CT T ACC CAGCCT TAAGGT CAAGGT CT ACAGCT CCAGCA 1487 

1355 — ATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACAC ACTGCACC 1402 

I I I I I I I I I I I I I I I I I I I I III 

1488 CCACGGGCTCTGGGCCAGGCCTGGCAGATGGGGCTGACCTGCTGGGGGTCTTGCCGCCTG 1547 

1403 ACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAGAACTACT 1462 

I I I I I I I I I I I I I I I I I I I I I I II 

154 8 GCACATACCCTAGCGATTTCGCCCGGGACACCCACTTCCTGCACCTGCGCAGCGCCAGCC 1607 

1463 TCCGCTC C CT GC C CC GAGGCAC CAGCAACAT GACCT AT GGGAC CT 1507 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1608 TCGGTTCCCAGCAGCTCTTGGGCCTGCCCCGAGACCCAGGGAGCAGCGTCAGCGGCACCT 1667 

1508 TCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCC 1567 

I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I 

1668 TTGGCTGCCTGGGTGGGAGGCTCAGCATCCCCGGCACAGGGGTCAGCTTGCTGGTGCCCA 1727 

1568 C AGAT GCCAT AC C CC GAGGGAAGAT CT ATGAGAT CT ACCT CAC GCT GCACAAGCCGGAAG 1627 

I MINIMI I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1728 AT GGAGCCATTCCCCAGGGCAAGTT CTACGAGATGTATCTACT CATCAACAAGGCAGAAA 1787 

1628 AC GT GAGGTT GCC C CTAGCT GGCT GT CAGACCCT GCT GAGT CC CAT CGTT AGCT GT GGAC 1687 

I II II II I I I I I I I I I I I I I I I I I II I I I I I 

1788 GT AC C CT GC C GCT TT CAGAAGGGAC CCAGACAGT ATT GAGC CC CT CGGT GACCT GT GGAC 1847 

1688 CCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCA 1747 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 
184 8 CCACAGGCCTCCTGCTGTGCCGCCCCGTCATCCTCACCATGCCCCACTGTGCCGAAGTCA 1907 

1748 GC CCT GAC AGCT GGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGC AGCT GGGAGGATG 1807 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1908 GTGCCCGTGACTGGATCTTTCAGCTCAAGACCCAGGCCCACCAGGGCCACTGGGAGGAGG 1967 

1 80 8 TGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTG 1867 
I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



1968 T GGT GAC CCT GGAT GAGGAGAC C CT GAACACAC CCT GCT ACTGC CAGCT GGAGC CCAGGG 2027 



Qy 1868 CCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCG 1927 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 2028 CCTGTCACATCCTGCTGGACCAGCTGGGCACCTACGTGTTCACGGGCGAGTCCTATTCCC 2087 

Qy 1928 TGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCG 1987 

I II I I I I I I I II I I I I I I I II II I I I I II I I I I I I I I I I 

Db 2088 GCTCAGCAGTCAAGCGGCTCCAGCTGGCCGTCTTCGCCCCCGCCCTCTGCACCTCCCTGG 2147 

Qy 1988 AGT ACAACAT CCGGGT CT ACT GCCTGCAT GACAC CCAC GAT GCACT CAAGGAGGT GGT GC 2047 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2148 AGT AC AGC CT C CGGGT CT ACT GCCT GGAGGACACGCCT GT AGCACT GAAGGAGGT GCTGG 2207 

Qy 2048 AGCTGGAGAAGCAGCT GGGGGGACAGCTGATCCAGGAGCCACGGGTCCT GCACTTCAAGG 2107 

I I I I I I I I I I I I I I I I I I III I I I I I I I II I I I I I I I 

Db 2208 AGCT GGAGCGGACT CT GGGCGGAT ACT T GGTGGAGGAGCC GAAACC GCT AAT GTT CAAGG 2267 

Qy 2108 AC AGTT ACCACAAC CT GC GCCT AT C CATCCAC GAT GT GCC CAGCTCCCT GT GGAAGAGT A 2167 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I 

Db 2268 ACAGTTACCACAAC CT GC GCCT CT C C CT CCAT GACCT C CCCCAT GCCCATT GGAGGAGCA 2327 

Qy 2168 AGCT C CT T GT CAGCT ACCAGGAGAT C C CCTTTT AT CACAT CTGGAAT GGCAC GCAGCGGT 2227 

I I I I II I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I III I 
Db 2328 AGCT GCT GGC CAAAT ACCAGGAGAT C C C CTTCT AT CACATTTGGAGT GGC AGCCAGAAGG 2387 

Qy 2228 ACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCA 2287 

I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I MINI 

Db 2388 CCCT C CACTGCACTTT CAC CCT GGAGAGGC AC AGCTT GGC CTC C ACAGAGCT C AC CT GCA 2447 

Qy 2288 AGCT GTGGGT GTGGCAGGT GGAGGGCGAC GGGCAGAGCT T CAGCAT CAACTT CAACAT CA 2347 

I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I II I 

Db 2448 AGAT CTGC GT GCGGCAAGT GGAAGGGGAGGGC CAGAT ATT C CAGCT GCAT AC CACTCT GG 2507 

Qy 2348 CCAAG GACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAG 2404 

III III II II I II I I I I 

Db 2508 CAGAGACACCTGCTGGCTCCCTGGACACTCTCTGCTCTGCCCCTGGCAGCACTGTCACCA 2567 

Qy 2405 CCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCA 2464 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II 
Db 2568 C CCAGCT GGGAC CTT AT GCCTT CAAGAT C C CACTGT CC AT C C GCCAGAAGAT AT GCAACA 2627 

Qy 2465 GCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACC 2524 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2628 GCCT AGAT GC CCC CAACT C ACGGGGCAAT GACT GGC GGAT GTT AGC ACAGAAGCT CT CTA 2687 

Qy 2525 T GGAC AGC CAT CT CAGCT T CTTT GC CT CCAAGC CCAG CC C CACAGC CAT GAT CCT CAAC C 2584 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I III 
Db 2688 TGGACCGGTACCTGAATTACTTTGCCACCAAAGCGAGCCCCACGGGTGTGATCCTGGACC 2747 

Qy 2585 TGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTG 2644 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III I 

Db 2748 TCT GGGAAGCT CT GCAGC AGGAC GAT GGGGAC CT CAACAGC CT GGCGAGT GC CTT GGAGG 2807 

Qy 2645 GACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2697 

I I I I I I I II I I MM MINIM 

Db 2808 AGAT GGGCAAGAGT GAGAT GCT GGT GGCT GTGGCC AC CGACGGGGACT GCT GA 2860 
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PRIOR APPLICATION NUMBER: 60/327,456 
PRIOR FILING DATE: 2001-10-05 
NUMBER OF SEQ ID NOS : 220 
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US-10-087-684-3 



Query Match 34.7%; Score 936.2; DB 17; Length 2860; 

Best Local Similarity 61.7%; Pred. No. 2.8e-232; 

Matches 1662; Conservative 0; Mismatches 938; Indels 93; Gaps 7; 



Qy 98 ACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATG 157 

III III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 168 ACTCCTTCCCGTCAGCGCCAGCAGAGCCGCTGCCCTACTTCCTGCAGGAGCCACAGGACG 227 

Qy 158 T GT ACAT CGT CAAGAACAAGCCAGT GCT GCTT GT GT GCAAGGCCGTGC CCGCCACGCAGA 217 

I I I I I I I I I I I I I I I I I I II I I I I I III I I I I I I I I I I I I I I I I 
Db 228 CCTACATTGTGAAGAACAAGCCTGTGGAGCTTCGCTGCCGCGCCTTCCCCGCCACACAGA 287 

Qy 218 TCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCA 277 

III I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II II 
Db 288 T CT ACTT CAAGT GCAACGGC GAGT GGGT CAGC CAGAACGACC AC GTCACACAGGAAGGCC 347 

Qy 278 CAGACGGGAGCAGTGGGCTGCCCACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGG 337 

I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 348 TGGATGAGGCCACCGGCCTGCGGGTGCGCGAGGTGCAGATCGAGGTGTCGCGGCAGCAGG 407 

Qy 338 TCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGG 397 

I III II I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I . 
Db 4 08 TGGAGGAGCTCTTTGGGCTGGAGGATTACTGGTGCCAGTGCGTGGCCTGGAGCTCCGCAG 467 

Qy 398 GCACCACCAAGAGTC AGAAGGCCT ACAT C CGCAT AGCC AGAT T GC GCAAGAACTT C GAGC 457 

I I I I I I I I I I I I I II I I I I I I I I I I I I I III I I I I I I I I I I II I I I I I 

Db 468 GCACCACCAAGAGTCGCC GAGC CT ACGT CCGC AT C GC CT AC CTGC GCAAGAACTTC GATC 527 

Qy 4 58 AGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCAC 517 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 528 AGGAGCCTCTGGGCAAGGAGGTGCCCCTGGACCATGAGGTTCTCCTGCAGTGCCGCCCGC 587 

Qy 518 CGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGT 577 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I II 
Db 588 C GGAGGGGGT GC CT GT GGC C GAGGT GGAAT GGCT CAAGAAT GAGGAT GTCATC GACC C CA 647 

Qy 578 C C CT GGACCC CAAT GT AT ACAT CAC GC GGGAGC AC AGC CT GGTGGTGCGACAGGCCCGCC 637 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I 

Db 648 CCCAGGACACCAACTTCCTGCTCACCATCGACCACAACCTCATCATCCGCCAGGCCCGCC 707 

Qy 638 TTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCG 697 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 708 TGTCGGACACTGCCAACTATACCTGCGTGGCCAAGAACATCGTGGCCAAACGCCGGAGCA 767 

Qy 698 CCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCG 757 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 768 CCACTGCCACCGTCATCGTCTACGTGAATGGCGGCTGGTCCAGCTGGGCAGAGTGGTCAC 827 

Qy 758 TCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGG 817 

I II I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I II I II I I I I I I 
Db 828 CCTGCTCCAACCGCTGTGGCCGAGGCTGGCAGAAGCGCACCCGGACCTGCACCAACCCCG 887 

Qy 818 CGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCA 877 

I II I I I I I I I I II II I I I I I I I I I I III I I I I I I I II I I I I I I III 

Db 888 CTCCACTCAACGGAGGGGCCTTCTGCGAGGGCCAGGCATTCCAGAAGACCGCCTGCACCA 947 
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Qy 
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Qy 
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Qy 
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Qy 

Db 
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878 



948 



938 



1008 



998 



CCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGG 937 
I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CCATCTGCCCAGTCGATGGGGCGTGGACGGAGTGGAGCAAGTGGTCAGCCTGCAGCACTG 1007 

ACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGG 997 
III I I I I I I I I II I I I I I I I I II I I II I I I I I I I II I I I I I I 
AGTGTGCCCACTGGCGTAGCCGCGAGTGCATGGCGCCCCCACCCCAGAACGGAGGCCGTG 1067 



AGT GC CAGGGCACT GACCT GGAC ACCCGCAACT GT AC CAGT GACCT CT GT GTACACAGT G 1057 
I I I I I I I I I I I I I I II I I I I I II I I I I III I 

1068 ACTGCAGCGGGACGCTGCTCGACTCTAAGAACTGCACAGATGGGCTGTGCATGCAACTGG 1127 

1058 CTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGG 1117 

I I I I I I I I I I I I I I I III I I I I 

1128 AGGCCTCAGGGGATGCGGCGCTGTATGCGGGGCTCGTGGTGGCCATCTTCGTGGTCGTGG 1187 

1118 TCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAG 1177 

III II II I I I I I I I I I I I I I I I I I I I I 

1188 CAATCCTCATGGCGGTGGGGGTGGTGGTGTACCGCCGCAACTGCCGTGACTTCGACACAG 1247 

1178 ATGTGGCTGACTCGTCCATT CT CACCT CAGGCT T CCAGCC CGT CAGC AT CAAGCCCA 1234 

I I I I I I I I I I I I MM I I I II I I I I II I II I I I I I I 

1248 ACATCACTGACTCATCTGCTGCCCTGACTGGTGGTTTCCACCCCGTCAACTTTAAGACGG 1307 

1235 GCAAAGCAGACAACCCCCATCTGCT CACCATCCAGCCGGACCTCAGCACCACCA 1288 

I I II I M II II II II II I I II I I I I Mil 

1308 CAAGGCC CAGTAAC C CGC AGCT C CT AC ACCCCT CT GT GCCT CCT GAC CT GACAGC CAGC G 1367 

1289 CCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGA 1325 

M II I II M M I I I I II II M II 

1368 C C GGCAT CT AC C GC GGAC CC GT GT ATGC CCT GCAGGACTCCAC C GACAAAATC C C CAT GA 1427 

1326 T GGGC C CAGCC C CAAGTT C CAGCT CACCA 1354 

I M I II I I M II M I I II 

1428 CCAACTCTCCTCTGCTGGACCCCTTACCCAGCCTTAAGGTCAAGGTCTACAGCTCCAGCA 1487 

1355 — ATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACAC ACTGCACC 14 02 

I II I I I I I II M I I II I I I I III 

14 88 CCACGGGCTCTGGGCCAGGCCTGGCAGATGGGGCTGACCTGCTGGGGGTCTTGCCGCCTG 1547 

1403 ACAGCTCT C CCAC CT CT GAGGC CGAGGAGTT CGT CT CCCGCCT CT C CACCC AGAACT ACT 1462 

I I I II I I I II I II I I M II I I I II 

1548 GCACATACCCTAGCGATTTCGCCCGGGACACCCACTTCCTGCACCTGCGCAGCGCCAGCC 1607 

1463 TCCGCTC CCT GCCCCGAGGCACCAGCAACAT GACCT AT GGGACCT 1507 

II I I I I I I I I M I II I I I I I II I II II I I 
1608 TCGGTTCCCAGCAGCTCTTGGGCCTGCCCCGAGACCCAGGGAGCAGCGTCAGCGGCACCT 1667 

1508 TCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCC 1567 

I II II I II M I II I I II I I I Mill I II M I II I II I 

1668 TTGGCTGCCTGGGTGGGAGGCTCAGCATCCCCGGCACAGGGGTCAGCTTGCTGGTGCCCA 1727 

1568 C AGAT GC CAT AC C C C GAGGGAAGAT CT AT GAGAT CTAC CT CAC GCT GCACAAGC CGGAAG 1627 

I II II I M I I II I I I M M II I M II I I I II II I I I II 

1728 AT GGAGCCAT T C C CC AGGGCAAGT T CT ACGAGAT GTAT CT ACT CAT CAACAAGGC AGAAA 1787 

162 8 ACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGAC 1687 
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I II II II I II 1 1 I 1 1 1 I 1 1 1 1 1 l 1 1 1 1 1 1 1 1 

1788 GTAC CCTGCCGCTTT CAGAAGGGAC CCAGACAGTATTGAGCCCCT CGGT GACCT GTGGAC 1847 

1688 CCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCA 1747 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 
1848 CCACAGGCCTCCTGCTGTGCCGCCCCGTCATCCTCACCATGCCCCACTGTGCCGAAGTCA 1907 

1748 GCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATG 1807 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

1908 GTGCCCGTGACTGGATCTTTCAGCTCAAGACCCAGGCCCACCAGGGCCACTGGGAGGAGG 1967 

1808 TGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTG 1867 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1968 T GGT GACC CT GGAT GAGGAGACC CT GAACACACCCT GCT ACT GC CAGCT GGAGC C CAGGG 2027 

1868 CCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCG 1927 

M I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

2028 C CT GT CACAT CCT GCT GGAC CAGCT GGGCACCT AC GTGTT CAC GGGC GAGT CCT ATT CC C 2087 

1928 TGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCG 1987 

I M I I I I I I I III I I I II I II II II I I I I I I I I I I I II I 

2088 GCTCAGCAGTCAAGCGGCTCCAGCTGGCCGTCTTCGCCCCCGCCCTCTGCACCTCCCTGG 2147 

1988 AGTACAAC AT CCGGGT CT ACT GC CT GCAT GACAC C CAC GAT GCACT CAAGGAGGT GGT GC 2047 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
2148 AGTACAGCCT CC GGGT CT ACT GC CT GGAGGACAC GCCT GT AGCACT GAAGGAGGT GCT GG 2207 

2048 AGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGG 2107 

I I II I I I I I I I I I I I I I I III I I I I I I I II I I I I II I 

2208 AGCT GGAGC GGACT CT GGGC GGAT ACTT GGTGGAGGAGC CGAAAC C GCTAAT GTT CAAGG 2267 

2108 AC AGTT AC C ACAAC CT GC GCCT AT C CAT C CAC GAT GT GC C CAGCTCC CT GT GGAAGAGT A 2167 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I 

2268 AC AGTT AC CACAAC CTGCGCCTCTCCCTC CAT GAC CTC C C CCAT GCCCATT GGAGGAGC A 2327 

2168 AGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGT 2227 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I 
2328 AGCT GCTGGC CAAAT AC CAGGAGAT CC C CTT CT AT CAC AT TT GGAGT GGCAGC CAGAAGG 2387 



2228 



2287 



ACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGT GACCT GGCCTGCA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2388 C C CT CCACT GC ACTTT CAC CCTGGAGAGGCACAGCTT GGCCT C C ACAGAGCT CAC CT GCA 2447 

2288 AGCT GT GGGT GT GGCAGGT GGAGGGCGACGGGCAGAGCTT C AGCAT CAACTT CAAC AT CA 2347 

I I I II I I I I I I I I I I I I II I I I I I I I I I II I I II I 

2448 AGATCTGCGTGCGGCAAGTGGAAGGGGAGGGCCAGATATTCCAGCTGCATACCACTCTGG 2507 

2348 CCAAG GACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAG 2404 

IN III II II I II I I I I 

2508 CAGAGACACCTGCTGGCTCCCTGGACACTCTCTGCTCTGCCCCTGGCAGCACTGTCACCA 2567 

2405 CCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCA 2464 
I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II 
C CCAGCTGGGAC CTT AT GC CTT CAAGAT C CCACT GT CCAT CC GC CAGAAGAT AT GCAAC A 



2568 



2627 



2465 GCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACC 
I I I I I I I IN II I II I I I I I I II I I I I I I I I I I I I I 



2524 



Db 



2628 GCCT AGAT GCCCCCAACT C ACGGGGCAATGACT GGCGGAT GTT AGCACAGAAGCT CTCT A 2687 



Qy 2525 TGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACC 2584 

I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I III 
Db 2688 TGGAC C GGT AC CTGAATT ACTTT GCCAC CAAAGC GAGCCCCAC GGGT GT GATC CT GGACC 2747 

Qy 2585 TGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTG 2644 

I I I I I I I I I I II I I I I I I I I I I I I I I I I II III I 

Db 2748 TCTGGGAAGCTCTGCAGCAGGACGATGGGGACCTCAACAGCCTGGCGAGTGCCTTGGAGG 2807 

Qy 2645 GACT GGGCCAGCCAGACGCT GGCCT CTT CACAGT GT CGGAGGCT GAGT GCT GA 2697 

I I I I I I I II I I I I I I I I I I I I I I 

Db 2808 AGAT GGGCAAGAGT GAGAT GCT GGT GGCT GT GGCCAC CGACGGGGACT GCT GA 2860 
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Qy 98 ACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATG 157 

III III II I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 168 ACTCCTTCCCGTCAGCGCCAGCAGAGCCGCTGCCCTACTTCCTGCAGGAGCCACAGGACG 227 

Qy 158 TGTACATCGTCAAGAACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGA 217 

I I I I I I I I I I I I I I I I I I I I I III III I I I I I I I I I I I I I I I I 

Db 228 CCTACATTGTGAAGAACAAGCCTGTGGAGCTCCGCTGCCGCGCCTTCCCCGCCACACAGA 287 

Qy 218 TCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCA 277 

I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I II I I I I I I II II 
Db 288 T CT ACTT CAAGT GCAACGGC GAGT GGGT C AGC CAGAAC GACCAC GTC ACAC AGGAAGGCC 347 

Qy 278 CAGACGGGAGCAGTGGGCTGCCCACCAT GGAGGT CCGCATTAAT GTCTCAAGGCAGCAGG 337 

I I I I II I I I I I I I I I I I I II I I I I I II I I I I I I I 

Db 34 8 TGGATGAGGCCACCGGTCTGCGGGTGCGCGAGGTGCAGATCGAGGTGTCGCGGCAGCAGG 407 

Qy 338 TCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGG 397 

I III II I II I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I III 
Db 408 TGGAGGAGCTCTTTGGGCTGGAGGATTACTGGTGCCAGTGCGTGGCCTGGAGCTCCGCGG 4 67 

Qy 398 GCAC CAC CAAGAGTCAGAAGGC CTAC AT CC GCAT AGC CAGATTGCGCAAGAACTTC GAGC 457 

I I I I I I I I I II II I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I 

Db 468 GCAC CAC CAAGAGT CGC CGAGC CT AC GT C C GCAT C GC CT AC CTGCGCAAGAACTT C GAT C 527 

Qy 458 AGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCAC 517 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 528 AGGAGCCTCTGGGCAAGGAGGTGCCCCTGGACCATGAGGTTCTCCTGCAGTGCCGCCCGC 587 

Qy 518 CGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGT 577 

I II II I I I Ml I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I 
Db 588 C GGAGGGGGT GC CT GT GGC C GAGGT GGAAT GGCT CAAGAAT GAGGAT GTC ATC GACCC C A 647 

Qy 578 CCCTGGACCCCAATGTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCC 637 

Ml I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 648 CCCAGGACACCAACTTCCTGCTCACCATCGACCACAACCTCATCATCCGCCAGGCCCGCC 707 

Qy 638 TTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCG 697 

I I I II I I I I I I I I I I II I I I I I I I I I I II I I I I I I I II I II I I II I III 

Db 708 T GT C GGACACT GC CAACT AT AC CT GCGT GGC CAAGAACATCGT GGCCAAAC GC C GGAGC A 767 

Qy 698 CCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCG 757 
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768 



758 



828 



818 



888 



878 



948 



938 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CCACTGCCACCGTCATCGTCTACGTGAATGGCGGCTGGTCCAGCTGGGCAGAGTGGTCAC 827 

TCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGG 817 

I I I I I ' I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I 
CCTGCTCCAACCGCTGTGGCCGAGGCTGGCAGAAGCGCACCCGGACCTGCACCAACCCCG 887 

CGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCA 877 
I II I II I I I I I II II I I I I I I I I II III I I I I I I I II I I I I I I III 

CT CCACTCAAC GGAGGGGCCTT CT GC GAGGGCC AGGC AT T C C AGAAGACCGC CT GCAC CA 947 

CCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGG 937 
I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

CCATCTGCCCAGTCGATGGGGCGTGGACGGAGTGGAGCAAGTGGTCAGCCTGCAGCACTG 1007 



ACT GC ACC CACT GGCGGAGC CGT GAGT GCT CTGACC CAGC AC CCC GCAAC GGAGGGGAGG 997 
III I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I 

1008 AGTGTGCCCACTGGCGTAGCCGCGAGTGCATGGCGCCCCCACCCCAGAACGGAGGCCGTG 1067 

998 AGT GCCAGGGCACT GAC CT GGAC AC C C GCAACT GTAC CAGT GACCT CT GTGTACACAGT G 1057 
I I I I I I I I I I I I I I I I I I I I I II I I I I III I 

1068 ACT GCAGCGGGACGCT GCT CGACT CTAAGAACT GCACAGAT GGGCT GT GC AT GCAACT GG 1127 

1058 CTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGG 1117 

I I I I I I II II I I I I I III I I I I 

1128 AGGCCTCAGGGGATGCGGCGCTGTATGCGGGGCTCGTGGTGGCCATCTTCGTGGTCGTGG 1187 

1118 TCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAG 1177 

III II II I I I I I I II I I I I I I I I I I I I 

1188 CAATCCTCATGGCGGTGGGGGTGGTGGTGTACCGCCGCAACTGCCGTGACTTCGACACAG 1247 

1178 AT GTGGCT GACT C GT C CAT T CT C AC CT CAGGCT T CCAGC CCGT CAGC AT CAAGC CCA 1234 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1248 ACATCACTGACTCATCTGCTGCCCTGACTGGTGGTTTCCACCCCGTCAACTTTAAGACGG 1307 

1235 GCAAAGCAGACAAC CCCC AT CT GCT CACCATCCAGCCGGACCTCAGCACCACCA 1288 

I I I I I I I I I I I I I II II I I I I I I I I I I I I 

1308 CAAGGCCCAGTAACCCGCAGCTCCTACACCCCTCTGTGCCTCCT GACCT GAC AGCCAGCG 1367 

1289 CCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGA 1325 

II I I I I I I I II llllllilllll 

1368 CCGGCAT CT ACC GC GGACC CGT GTAT GC C CT GCAGGACT CCAC CGACAAAAT C CC CAT GA 1427 

1326 TGGGCCCAGCCCCAAGTTCCAGCTCACCA 1354 

I I I I I I I I I I I I I I I I II 

1428 CCAACTCTCCTCTGCTGGACCCCTTACCCAGCCTTAAGGTCAAGGTCTACAGCTCCAGCA 1487 

1355 — ATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACAC ACTGCACC 1402 

llllllilllll I I I I I I I I III 

1488 CCACGGGCTCTGGGCCAGGCCTGGCAGATGGGGCTGACCTGCTGGGGGTCTTGCCGCCTG 1547 

1403 AC AGCT CT C CC ACCT CT GAGGCCGAGGAGTT CGT CTCCCGCCT CT CCAC CCAGAACT ACT 1462 

I I I I I I I I III Ml I I I I I I I I II 

1548 GCACATACCCTAGCGATTTCGCCCGGGACACCCACTTCCTGCACCTGCGCAGCGCCAGCC 1607 



1463 TCCGCTC- 
I I I I I 



- CCT GC C CCGAGGCACC AGCAACAT GAC CT AT GGGAC CT 1507 
I I I I I II I I I I I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1608 TCGGTTCCCAGCAGCTCTTGGGCCTGCCCCGAGACCCAGGGAGCAGCGTCAGCGGCACCT 1667 

1508 TCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCC 1567 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1668 TTGGCTGCCTGGGTGGGAGGCTCAGCATCCCCGGCACAGGGGTCAGCTTGCTGGTGCCCA 1727 

1568 C AGAT GCCAT ACC CC GAGGGAAGAT CT AT GAGATCT ACCT CACGCT GCACAAGCC GGAAG 1627 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1728 AT GGAGCC ATT C CCC AGGGCAAGTT CT ACGAGAT GTAT CT ACT CAT CAACAAGGCAGAAA 1787 

1628 ACGT GAGGTT GC C CCT AGCT GGCT GT CAGAC C CT GCT GAGT CCCAT C GT T AGCTGT GGAC 1687 

I II II II I I I I I I I I I I I I I I I I I I I I I I I I 

1788 GT AC CCT GCCGCT TT CAGAAGGGACCCAGACAGT ATTGAGCCC CT C GGT GACCT GT GGAC 1847 

1688 CCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCA 1747 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 

1848 CCACAGGCCTCCTGCTGTGCCGCCCCGTCATCCTCACCATGCCCCACTGTGCCGAAGTCA 1907 

1748 GCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATG 1807 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1908 GT GC CCGT GACT GGATCTTT CAGCT CAAGACCCAGGC CCACCAGGGC C ACT GGGAGGAGG 1967 

1808 TGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTG 1867 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1968 T GGTGACCCTGGAT GAGGAGACCCT GAACACACCCT GCTACTGCCAGCTGGAGCCCAGGG 2027 

1868 CCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCG 1927 

I II I I I I I I I I I I I II I I I I II I I I I I I I I I I I 

2028 CCTGTCACATCCTGCTGGACCAGCTGGGCACCTACGTGTTCACGGGCGAGTCCTATTCCC 2087 

1928 TGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCG 1987 

I II I I I I I I I III I I I I I I II II II I I I I I I I I I I I I I I 

2088 GCTCAGCAGTCAAGCGGCTCCAGCTGGCCGTCTTCGCCCCCGCCCTCTGCACCTCCCTGG 2147 

1988 AGTACAACAT C CGGGT CT ACT GC CT GCATGACACC CACGAT GCACT CAAGGAGGTGGT GC 2047 

I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

2148 AGTACAGCCTCCGGGTCT ACT GCCTGGAGGACACGCCTGTAGC ACT GAAGGAGGT GCT GG 2207 

2048 AGCT GGAGAAGCAGCT GGGGGGACAGCT GAT CC AGGAGCCACGGGT C CTGC ACTT CAAGG 2107 

I I I I I I I I I I I I I I I I I I III I I I I I I I II I I I I I I I . 

2208 AGCTGGAGCGGACTCTGGGCGGATACTTGGTGGAGGAGCCGAAACCGCTAATGTTCAAGG 2267 

2108 AC AGTTACCACAAC CT GC GC CT AT C CAT CCAC GAT GT GCCC AGCT C C CTGT GGAAGAGT A 2167 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I III I I I I I I I I 

2268 ACAGTT AC CACAAC CT GC GC CT CT C CCT CCAT GAC CT C CC C CAT GC C CATT GGAGGAGCA 2327 

2168 AGCT C CT T GT CAGCT AC CAGGAGAT CC CCTT TT AT CAC AT CTGGAAT GGC ACGCAGC GGT 2227 
I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I 

AG CT GCT GGC CAAATAC CAGGAGAT C C CCT T CT AT CAC ATTTGGAGT GGC AGC CAGAAGG 2387 



2328 



2228 



2388 



2288 



ACT T GCACTGC ACCT TCACCCT GGAGC GTGT CAGCCC CAGCACT AGT GAC CT GGC CT GCA 2287 

I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I 

CCCTCCACTGCACTTTCACCCTGGAGAGGCACAGCTTGGCCTCCACAGAGCTCACCTGCA 2447 



2347 



AGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACATCA 
I I I II Ml III I I Mil II M II II I I I II II II I 

244 8 AGATCTGCGTGCGGCAAGTGGAAGGGGAGGGCCAGATATTCCAGCTGCATACCACTCTGG 2507 



Qy 

Db 

Qy 

Db 

Qy 
Db 



2348 CCAAG GACACAAGGTT T GCT GAGCT GCT GGCT CT GGAGAGT GAAGC GGGGGT C CCAG 2404 

III III II II I II II I I 

2508 CAGAGACACCTGCTGGCTCCCTGGACACTCTCTGCTCTGCCCCTGGCAGCACTGTCACCA 2567 

2405 CCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCA 2464 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
2568 CC C AGCT GGGACCTT AT GCCTT CAAGAT CCC ACT GT CCAT CCGC CAGAAGAT AT GCAACA 2627 



2465 



2524 



GCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACC 
MM II I Ml I II II II I I II I I II I I I I I I I I I I I 

2628 GCCTAGATGCCCCCAACTCACGGGGCAATGACTGGCGGATGTTAGCACAGAAGCTCTCTA 2687 



Qy 2525 TGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACC 2584 

II I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I III 
Db 2688 TGGACCGGTACCTGAAT TACT TTGCCACCAAAGCGAGCCCCACGGGTGT GAT CCTGGACC 2747 

Qy 2585 TGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTG 2644 

I I I I II II I I II I I I I I II II I I I I I I I II III I 

Db 2748 T CT GGGAAGCT CTGCAGCAGGACGATGGGGACCT CAACAGCCT GGC GAGT GC CTT GGAGG 2807 

Qy 2645 GACTGGGCCAGCCAGAC GCT GGCCT CTT CACAGTGTCGGAGGCT GAGT GCT GA 2697 

I I II I II M I I I I I I I I I I I I I I 

Db 2808 AGATGGGCAAGAGT GAGAT GCT GGT GGCT GT GGC CAC CGACGGGGACT GCT GA 2860 



RESULT 15 
US-10-218-779-3 

Sequence 3, Application US/10218779 
Publication No. US20040029222A1 
GENERAL INFORMATION: 



APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 



Edinger, Shlomit 
MacDougall, John 
Millet, Isabelle 
Ellerman, Karen 
Stone, David 
Gerlach, Valerie 
Grosse, William 
Alsobrook II, John 
Lepley, Denise 
Rieger, Daniel 
Burgess, Catherine 
Casman, Stacie 
Spytek, Kimberly 
Boldog, Ferenc 
Li, Li 

Padigaru, Muralidhara 
Mishra, Vishnu 
Patturajan, Meera 
Shenoy, Suresh 
Rastelli, Luca 
Tchernev, Velizar 
Vernet, Corine 
Zerhusen, Bryan 
Malyankar, Uriel 
Guo, Xiaojia 
Miller, Charles 



; APPLICANT: Gangolli, Esha 

; TITLE OF INVENTION: Proteins and Nucleic Acids Encoding Same 
; FILE REFERENCE: 21402-214 

; CURRENT APPLICATION NUMBER: US/10/218 f 779 

; CURRENT FILING DATE: 2002-08-14 

; PRIOR APPLICATION NUMBER: 60/253,834 

; PRIOR FILING DATE: 2000-11-29 

; PRIOR APPLICATION NUMBER: 60/250,-926 

; PRIOR FILING DATE: 2000-11-30 

; PRIOR APPLICATION NUMBER: 60/264,180 

; PRIOR FILING DATE: 2001-01-25 

; PRIOR APPLICATION NUMBER: 60/313,656 

; PRIOR FILING DATE: 2001-08-20 

; PRIOR APPLICATION NUMBER: 60/327,456 

; PRIOR FILING DATE: 2001-10-05 

; NUMBER OF SEQ ID NOS : 216 

; SOFTWARE: Patentln Ver. 2.1 

; SEQ ID NO 3 

; LENGTH: 2860 

; TYPE: DNA 

; ORGANISM: Homo sapiens 

US-10-218-779-3 

Query Match 34.7%; Score 936.2; DB 17; Length 2860; 

Best Local Similarity 61.7%; Pred. No. 2.8e-232; 

Matches 1662; Conservative 0; Mismatches 938; Indels 93; Gaps 7; 



Qy 98 ACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATG 157 

III III II I I I I I I I I I I I I I I I I I I MINI I I II I 

Db 168 ACTCCTTCCCGTCAGCGCCAGCAGAGCCGCTGCCCTACTTCCTGCAGGAGCCACAGGACG 227 

Qy 158 T GT ACAT CGT CAAGAACAAGCCAGT GCT GCTT GT GT GCAAGGCC GT GCCC GC C ACGC AGA 217 

I I I I I I I I I I I I I I I I I I I I I MM III I I I I II I II I II I I M 

Db 228 CCTACATTGTGAAGAACAAGCCTGTGGAGCTTCGCTGCCGCGCCTTCCCCGCCACACAGA 287 

Qy 218 TCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCA 277 

I II I I I II I II M I II I I I I II I II I Mill I I I I I I II I II II 
Db 288 TCTACTT CAAGTGCAACGGCGAGTGGGT CAGCCAGAACGACCACGTCACACAGGAAGGCC 347 

Qy 278 C AGACGGGAGCAGT GGGCT GCCC AC CAT GGAGGT CC GC AT TAAT GT CT CAAGGCAGCAGG 337 

I I I I I I II I III Mill I II I II II II III! Ill 

Db 348 T GGAT GAGGC CACC GGC CT GC GGGT GC GC GAGGT GCAGAT CGAGGT GT C GC GGCAGCAGG 407 

Qy 338 TCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGG 397 

I III II I I I I I M I I I M M I I I II I II II M I I M I I I I II II I I I II I I 
Db 408 TGGAGGAGCTCTTT GGGCT GGAGGATTACTGGTGCCAGTGCGT GGC CTGGAGCTCCGCAG 467 

Qy 398 GCACCAC CAAGAGT CAGAAGGC CT ACAT CCGC AT AG C C AGAT TGCGCAAGAACTT CGAGC 457 

I II I I I I M I II I I I II II I I I II M II III I I M I II I II I I II I I I 

Db 468 GC AC CAC CAAGAGT C GC CGAGC CTACGT CCGC AT CGC CT AC CTGC GCAAGAACTT CGAT C 527 

Qy 458 AGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCAC 517 

II II II I I II I I I I II I I I I I M I M I I I I I I I I I I I II I I I I I I 

Db 528 AGGAGCCTCTGGGCAAGGAGGTGCCCCTGGACCATGAGGTTCTCCTGCAGTGCCGCCCGC 587 

Qy 518 CGGAGGGCATCCCTCCAGC CGAGGT GGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGT 577 

I I II I II I I II I I I I I I I M I I M I I I I I M I I I M I I I II I I 



588 C GGAGGGGGT GCCT GT GGC C GAGGT GGAAT GGCT CAAGAAT GAGGAT GT C AT CGAC CCCA 647 



578 CCCT GGAC CC CAAT GTAT ACAT CACGCGGGAGCACAGCCT GGTGGT GCGACAGGCC CGCC 637 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I 

648 CCCAGGACACCAACTTCCTGCTCACCATCGACCACAACCTCATCATCCGCCAGGCCCGCC 707 

638 TTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCG 697 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I III 

708 T GT CGGACACTGC CAACT AT ACCT GC GT GGC CAAGAACAT CGTGGC CAAACGC CGGAGCA 767 

698 CCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCG 757 

II I II I I I I I I I I I I I I I I I I I I II II I I I I I I III I I I I I I I I I 

768 CC ACT GC C AC C GT CATCGT CT ACGT GAAT GGCGGCT GGT C CAGCTGGGCAGAGT GGT CAC 827 

758 TCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGG 817 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
828 CCTGCTCCAACCGCTGTGGCCGAGGCTGGCAGAAGCGCACCCGGACCTGCACCAACCCCG 887 

818 CGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCA 877 

I II I I I I I I I I II II I I I I I I I I I I III I I I I I I I II I I I I I I III 

888 CT CCACT CAACGGAGGGGC CTT CT GC GAGGGCCAGGCATT C CAGAAGACC GC CTGCACCA 947 

878 CCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGG 937 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

948 C CAT CT GC C CAGT CGAT GGGGC GT GGAC GGAGT GGAGCAAGT GGT CAGC CT GCAGCACTG 1007 

938 ACT GCAC C CACT GGCGGAGCCGT GAGT GCT CTGAC C C AGCAC CCCGCAACGGAGGGGAGG 997 

III I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
1008 AGTGTGCCCACTGGCGTAGCCGCGAGTGCATGGCGCCCCCACCCCAGAACGGAGGCCGTG 1067 

998 AGT GCCAGGGCACT GACCT GGAC ACCCGCAACT GT AC CAGT GAC CT CT GT GT ACACAGTG 1057 
I I I I I I I I I I I I I I I I I I I I I II I I I I III I 

1068 ACTGCAGCGGGACGCTGCTCGACTCTAAGAACTGCACAGATGGGCTGTGCATGCAACTGG 1127 

1058 CTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGG 1117 

I Mill I I I I I I I I I III I I I I 

1128 AGGCCTCAGGGGATGCGGCGCTGTATGCGGGGCTCGTGGTGGCCATCTTCGTGGTCGTGG 1187 

1118 TCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAG 1177 

III II II I I I I I I I I I I I I I I I I I I I I 

1188 CAAT CCT CAT GGCGGTGGGGGT GGTGGT GTACCGCCGCAACTGCCGTGACTTCGACACAG 1247 

1178 AT GTGGCTGACT CGTCCATT CTCACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCA 1234 

I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1248 ACAT CACT GACT CAT CT GCT GC C CT GACT GGT GGT TT C CACC CC GT CAACTTTAAGACGG 1307 

1235 GCAAAGCAGACAACC CC CAT CT GCT CACCATCCAGCCGGACCTCAGCACCACCA 1288 

I I I I II I I I I I I I I I II I I I I I I I I I I I I 

1308 CAAGGC C CAGT AAC C CGC AGCT C CT ACAC C C CT CT GT GCCT C CT GAC CT GACAGCCAGCG 1367 

1289 CCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGA 1325 

II I I I I I I I II I I I I I I I I I I I I 

1368 CCGGCAT CT ACC GC GGAC C C GT GT AT GC C CT GCAGGACT C CACCGACAAAAT C C C CAT GA 1427 

1326 TGGGCCCAGCCCCAAGTTCCAGCTCACCA 1354 

III I I I I I IT II II II II 
1428 CCAACTCTCCTCTGCTGGACCCCTTACCCAGCCTTAAGGTCAAGGTCTACAGCTCCAGCA 1487 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1355 — ATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACAC ACTGCACC 1402 

I I I I I I I I I I I I I I I I I I I I III 

1488 CCACGGGCTCTGGGCCAGGCCTGGCAGATGGGGCTGACCTGCTGGGGGTCTTGCCGCCTG 1547 

1403 AC AGCT CT CCCACCT CT GAGGC CGAGGAGTT CGT CT CCC GC CT CT CCAC C CAGAACTACT 1462 

I I I I I I I I I I I I II I I I I I I I I II 

1548 GCACATACCCTAGCGATTTCGCCCGGGACACCCACTTCCTGCACCTGCGCAGCGCCAGCC 1607 

1463 TCCGCTC C CT GCC CC GAGGC ACCAGCAAC AT GACCT ATGGGACCT 1507 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

1608 TCGGTTCCCAGCAGCTCTTGGGCCTGCCCCGAGACCCAGGGAGCAGCGTCAGCGGCACCT 1667 

1508 TCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCC 1567 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1668 TTGGCTGCCTGGGTGGGAGGCTCAGCATCCCCGGCACAGGGGTCAGCTTGCTGGTGCCCA 1727 



1568 



1627 



CAGAT GCCAT AC CC C GAGGGAAGAT CTAT GAGAT CT ACCT CACGCT GCACAAGCC GGAAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1728 AT GGAGCCATTC C C C AGGGCAAGTT CTAC GAGAT GTATCT ACTCAT CAACAAGGCAGAAA 1787 

1628 ACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGAC 1687 

I II II II I I I I I I I I I I I I I II I II I I II I I 

1788 GT ACC CT GC CGCT TT CAGAAGGGAC CCAGACAGT ATTGAGC C CCT CGGT GACCT GT GGAC 1847 

1688 CCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCA 1747 

I I I I I I I I I I I I I I I I I I I I I I I I I I MM II II II I I II II 
1848 CCACAGGCCTCCTGCTGTGCCGCCCCGTCATCCTCACCATGCCCCACTGTGCCGAAGTCA 1907 

1748 GCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATG 1807 

I I Mill I I I IMMI I I I I I II I II I I I I I I I I I I 

1908 GTGCCCGTGACTGGATCTTTCAGCTCAAGACCCAGGCCCACCAGGGCCACTGGGAGGAGG 1967 

1808 TGCTGC ACCT GGGCGAGGAGGCGCCCTCCCACCTCT ACT ACT GCCAGCTGGAGGCCAGTG 1867 

MM I Ml I I II I II I I I I II II I II I I II I M I II I I I II I 

1968 T GGT GAC CCTGGAT GAGGAGACCCT GAAC AC ACC CT GCT ACT GC CAGCT GGAGCC CAGGG 2027 

1868 CCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCG 1927 

MM II I I I I I I II I II I II II I I I I I II I M I 

2028 CCTGTCACATCCTGCTGGACCAGCTGGGCACCTACGTGTTCACGGGCGAGTCCTATTCCC 2087 
1928 TGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCG 1987 

I M I I II M I M I Mill I II M II I II II I II II I II I 

2088 GCTCAGCAGTCAAGCGGCTCCAGCTGGCCGTCTTCGCCCCCGCCCTCTGCACCTCCCTGG 2147 

1988 AGT ACAACAT C C GGGT CT ACT GC CT GCAT GACACC C AC GAT GCACT CAAGGAGGT GGT GC 2047 

II I I I I I I I II I I II II I I II II I I I I II I I I I I II I I II II I I M II 

214 8 AGTACAGCCTCCGGGTCTACTGCCTGGAGGACACGCCTGTAGCACTGAAGGAGGTGCTGG 2207 

204 8 AGCTGGAGAAGCAGCTGGGGGGACAGCT GAT CCAGGAGCCACGGGTCCT GCACTTCAAGG 2107 

II I II II I I II I II I II I II I II II II I II I I I II I I 

2208 AGCTGGAGCGGACTCTGGGCGGATACTTGGTGGAGGAGCCGAAACCGCTAATGTTCAAGG 2267 

2108 AC AGTT ACCACAAC CTGCGC CT AT C CAT CCAC GAT GT GC CCAGCT C C CT GT GGAAGAGT A 2167 
I M M II II II II I II II I I II II I I I II II I I II III II II II I I 

AC AGT T ACCACAAC CTGCGC CT CTCC CT C CAT GAC CT CCC C CAT GC C C ATT GGAGGAGCA 2327 



2268 



Qy 

Db 



2168 AGCT C CT T GT CAGCT AC CAGGAGAT CCCCTTTT AT CAC AT CT GGAAT GGCACGCAGCGGT 2227 

-I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I. Ill I 
2328 AGCT GCT GGC CAAAT AC CAGGAGAT CCCCTTCT AT CACATTT GGAGT GGCAGCCAGAAGG 2387 



Qy 2228 ACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCA 2287 

I I I I I I I I I I I I I I I I I I I I I I I II I I III I I I I I I I I I I 

Db 2388 CCCTCCACTGCACTTTCACCCTGGAGAGGCACAGCTTGGCCTCCACAGAGCTCACCTGCA 2447 

Qy 2288 AGCT GT GGGT GT GGC AGGT GGAGGGC GAC GGGCAGAGCTT C AGC AT CAACTT CAACAT CA 2347 

I I I I I I I I I I I I I II I I I I II I I I I I I III I I II I 

Db 2448 AGAT CTGC GT GC GGCAAGT GGAAGGGGAGGGCCAGAT ATT C CAGCT GCAT AC CACT CT GG 2507 

Qy 2348 CCAAG GACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAG 2404 

III III M II I II I I I I 

Db 2508 CAGAGAC AC CT GCT GGCT C CCT GGACACTCT CT GCT CT GC C CCT GGCAGC ACT GT CACCA 2567 

Qy 2405 CCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCA 2464 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2568 C C CAGCT GGGAC CTT AT GCCTTCAAGAT CCCACT GT CCAT CCGCCAGAAGAT ATGCAACA 2627 

Qy 24 65 GCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACC 2524 

I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I 

Db 2628 GCCTAGATGCCCCCAACTCACGGGGCAATGACTGGCGGATGTTAGCACAGAAGCTCTCTA 2687 

Qy 2525 T GGACAGC CAT CT CAGCTT CTTT GC CT C CAAGC C CAGC C C CACAGC C AT GAT CCT CAACC 2584 

I I I I I I Mil I I I I I I I I I I I I I I II I I I I I I I I I I I I I III 
Db 2688 T GGACCGGT ACCT GAAT T ACTTT GC CACCAAAGC GAGC C C CACGGGT GT GAT CCT GGACC 2747 

Qy 2585 TGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTG 2644 

I I I I I I I I I I I I I I I I I II I II I I I I I I - II IN I 

Db 2748 TCTGGGAAGCTCTGCAGCAGGACGATGGGGACCTCAACAGCCTGGCGAGTGCCTTGGAGG 2807 

Qy 2645 GACT GGGC CAGC CAGAC GCT GGCCT CTTCACAGT GT CGGAGGCTGAGTGCT GA 2 697 

I I I I I I I II I I MM I I I I I II I 

Db 2808 AGAT GGGCAAGAGTGAGAT GCTGGT GGCTGT GGCCACCGACGGGGACTGCT GA 2860 



Search completed: March 6, 2005, 17:04:14 
Job time : 1484.63 sees 



